前 言 


BootLoader 就 是 在 操作 系统 内 核 运 行 之 前 运行 的 一 段 小 程序 。 通 过 这 段 小 程序 ， 我 们 可 以 初始 化 硬件 设备 、 建 立 内 存 空 间 的 映射 ， 从 而 将 系统 的 软 硬 件 环境 设置 
成 一 个 合适 的 状态 ， 以 便 为 最 终 调用 操作 系统 内 核准 备 好 正确 的 环境 。 


在 谋 入 式 系统 中 ， 通 常 没有 像 PC 中 的 BIOS 那 样 的 固件 程序 ， 因 此 整个 系统 的 加 载 启动 任务 就 完全 由 BootLoadet 来 完成 。BootLoadet 是 CPU 上 电 后 运行 的 第 一 段 程 
它 的 作用 就 是 对 嵌入 式 系统 中 的 硬件 进行 初始 化 ， 创 建 内 核 需 要 的 一 些 信息 并 将 这 些 信 息 通 过 相关 机 制 传递 给 内 核 ， 从 而 将 系统 的 软 硬 件 环境 带 到 一 个 合适 的 状 
最 终 调用 操作 系统 内 核 ， 真 正 起 到 引导 和 加 载 内 核 的 作用 。 实 际 上 ， 一 个 功能 比较 强大 的 BootLoader 已 经 相当 于 一 个 微型 的 操作 系统 了 。 


不 同 的 CPU 体系 结构 有 不 同 的 BootLoader。 有 些 BootLoader 支 持 多 种 体系 结构 的 CPU， 比 如 U-Boot 就 同时 支持 ARM 体 系 结构 和 MIPS 体 系 结构 。 除 了 依赖 于 CPU 的 体 

结构 外 ，BootLoader 实 际 上 也 依赖 于 有 具体 的 岁入 式 板 级 设备 的 配置 。 也 就 是 说 ， 对 于 两 块 不 同 的 谈 入 式 板 而 言 ， 即 使 它们 是 基于 同一 种 CPU 而 构建 的 ， 要 想 让 运行 
在 一 块 板子 上 的 BootLoader 程 序 也 能 运行 在 另 一 块 板 子 上 ， 通 常 需要 修改 BootLoadet 的 源 程序 。 因 此 每 款 嵌 入 式 产 品 的 BootLoader 都 是 独一无二 的 ， 但 我 们 可 以 总 结 出 
开发 或 者 维护 特定 BootLoadet 需 要 哪些 背景 知识 ， 掌 握 了 这 些 背 景 知识 ， 我 们 就 可 以 做 到 以 不 变 应 万 变 。 


为 了 引导 操作 系统 ，BootLoader 与 CPU 体 系 结构 和 操作 系统 有 着 非常 紧密 的 联系 。 在 本 书 中 ,我们 以 ARM 体 系 结构 和 识 入 式 Linux 操 作 系 统 为 原型 讲述 BootLoader 
的 原理 。 通 过 理论 联系 实践 的 方法 论 ， 让 读者 理解 BootLoadet 的 概念 ， 掌 握 开 发 BootLoader 的 方法 。 本 书 适 合 从 单片机 向 ARM 过 渡 并 希望 了 解 举 入 式 开发 的 在 校 学 生 
以 及 想 要 从 事 BootLoader 开 发 移植 工作 的 工程 师 参 考 使 用 。 


下 面 来 梳理 一 下 需要 哪些 背景 知识 : 





1) 因为 我 们 引导 的 操作 系统 是 Linux， 所 以 需要 熟悉 Linux 开 发 环境 。BootLoader 也 是 一 串 人 代码， 我 们 必须 了 解 Linux 下 编辑 器 和 编译 器 的 用 法 ; 作为 Linux 下 的 开发 
者 ， 对 shell 脚 本 和 Make 工 程 管理 工具 也 要 有 必要 的 了 解 。 第 1 章 对 BootLoader 做 了 基本 介绍 ， 第 2 章 则 详细 介绍 了 Linux 开 发 环境 。 








2) 因为 我 们 仅仅 以 ARM 体 系 结构 作为 原型 ， 所 以 会 在 第 3~5 章 讲述 ARM 体 系 结构 、ARM 指 令 集 和 ARM 独 特 的 寻 址 模式 。 


3) 很 多 嵌入 式 开发 人 员 都 是 通信 、 电 子 和 自动 化 等 专业 的 ， 对 于 计算 机 的 编译 和 链接 掌握 得 不 够 深入 ， 因 此 第 6 章 介绍 编译 和 链接 。 控 制 链接 行为 的 链接 脚本 是 
特有 的 脚本 语言 ， 第 7 章 比 较 详细 地 介绍 了 该 脚本 的 细节 。 





通 前 面 各 章节 的 理论 ， 接 着 第 9 章 对 U-Boot 代 码 展开 分 析 ， 最 后 在 第 10 章 一 步 一 步 地 实现 了 BootLoader。 在 此 过 程 中 ， 我 们 更 注 


会 贯通 ， 不 会 花 太 多 篇 幅 讲 解 DRAM、MMC 等 模块 的 驱动 。 


重 ARM 体 系 结构 、 编 译 链接 等 知识 的 融 


书 能 够 成 书 ， 要 感谢 LinkSprite 团 队 的 资源 支持 和 左 宝 柱 在 pcDuino v3 平台 上 的 帮助 。 最 后 感谢 家 人 和 朋友 对 我 的 支持 ， 鼓 励 我 完成 这 项 值得 用 心 去 做 的 工作 。 
因 作者 水 平 有 限 且 时 间 仓促 ， 书 中 难免 存在 疏漏 ， 还 望 广大 读者 不 吝 赐 教 。 
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第 1 章 ”BootLoader 的 概念 


本 章 导读 


本 书 讲述 的 主题 是 BootLoader， 那 么 BootLoadet 是 什么 呢 ? 首先 从 字面 上 来 看 ，BootLoadet 是 一 个 英文 单词 ， 那 它 是 什么 意思 呢 ? 如 果 使 用 词典 查询 一 下 ， 会 得 到 
这 样 的 结果 : “对 不 起 ， 词 库 中 没有 您 查询 的 单词 ! 您 要 查找 的 是 不 是 : Boot Loader Boot-Loader” Boot Loadet[ 计 ] 引 导 装 载 程序 。 


可 以 看 到 BootLoader 应 该 是 Boot 和 Loader 这 两 个 单词 的 组 合 。Boot 的 意思 是 “[ 计 算 机 科学 ] 引 导 ”， 而 Loader 是 “加 载 器 ”的 意思 。 因 此 可 以 推断 
BootLoader 这 个 词 是 随 着 计算 机 科学 的 发 展 而 衍生 出 现 的 。 


1.1 节 介绍 BootLoader 在 嵌入 式 系统 或 者 计算 机 系统 中 所 扮演 的 角色 。 


1.2 节 结合 半导体 芯片 技术 、 计 算 机 技术 以 及 软件 工程 技术 的 发 展 历 史 来 探究 BootLoader 的 出 现 过 程 ， 从 而 说 明 BootLoader 的 来 历 和 它 在 整个 计算 机 系统 中 的 
定位 、 概 念 以 及 作用 。 


1.3 节 阐述 BootLoader 的 概念 ， 并 以 MCU 下 的 BootLoader、 罕 入 式 ARM 和 Linux 下 的 BootLoader 和 PC 下 的 引导 流程 为 例 进行 说 明 。 


1.1 BootLoader 的 角色 


当 一 个 嵌入 式 开 发 板 上 电 时 ， 哪 怕 执 行 最 简单 的 程序 ， 都 要 初始 化 非常 多 的 硬件 。 每 种 体系 结构 、 处 理 器 都 有 一 组 预定 义 的 动作 和 配置 ， 它 们 包含 从 单 板 的 存储 
设备 获取 初始 化 代码 的 功能 。 最 初 的 初始 化 代码 是 BootLoader 的 一 部 分 ， 它 负责 启动 处 理 器 和 相关 硬件 设备 。 

















在 上 电 复 位 时 ， 大 多 数 处 理 器 都 有 一 个 获取 第 一 条 执行 指令 的 默认 地 址 。 硬 件 设计 人 员 利 用 该 信息 来 进行 存储 空间 的 布局 。 这 样 一 来 ， 上 电 的 时 候 可 从 一 个 通用 
的 已 知 地址 获取 代码 ， 然 后 建立 软件 的 控制 。 


BootLoader 提 供 最 初 的 初始 化 代码 ， 并 初始 化 单 板 ， 这 样 就 可 以 执行 其 他 的 程序 。 最 初 的 初始 化 代码 都 是 由 该 处 理 器 体系 结构 下 的 汇编 语言 写成 。 当 然 ， 在 
BootLoader 已 经 执行 完 基本 的 处 理 器 和 平台 的 初始 化 之 后 ， 它 的 主要 工作 就 是 引导 完整 的 操作 系统 。 它 将 定位 、 加 载 操作 系统 ， 并 将 控制 权 移交 给 操作 系统 。 另 
外 ，BootLoader 可 能 含有 一 些 高 级 特性 ， 比 如 校 验 OS 镜 像 、 升 级 OS 镜像 、 从 多 个 OS 镜像 中 选择 性 引导 。 与 传统 的 PC-BIOS 不 同 ， 当 操作 系统 获取 控制 权 后 ， 许 入 
式 下 的 BootLoader 就 不 复 存 在 了 。 


1.2 ”BootLoader 的 来 历 


我 们 从 4 个 角度 来 阐述 BootLoader 的 来 历 ， 第 一 个 是 从 半导体 芯片 技术 (特别 是 处 理 器 的 发 展 ) 来 看 Boot 的 出 现 : 





在 集成 电路 只 读 存储 器 出 现 之 前 ， 早 期 的 计算 机 ENIAC 在 存储 中 并 没有 程序 ， 而 是 通过 连接 电缆 的 配置 来 解决 问题 。ENIAC 中 并 没有 自 举 电路 或 引导 程序 ， 因 为 
它 只 要 上 电 ， 其 硬件 配置 就 开始 解决 问题 。 在 早期 的 计算 机 中 ， 根 本 就 没有 BootLoader 的 概念 ， 连 Boot 这 个 名 称 都 没有 。 











稍 晚 时 间 出 现 的 1BM 701 计 算 机 (1952~1956 年 ) 有 一 个 “Load” 按 键 ， 按 下 它 ， 可 以 从 外 部 储存 中 加 载 最 初 的 36 位 的 字 到 主 存 中 。 有 一 个 加 载 选择 开关 来 决 
定 外 部 储存 是 穿孔 卡片 、 磁 带 ， 还 是 磁 鼓 〈 看 到 这 里 是 不 是 觉得 它 和 现代 的 庶 入 式 系统 有 些 类 似 ， 在 有 些 嵌 入 式 电路 板 中 ， 同 样 用 一 些 拨 码 开关 来 控制 电路 板 从 SD 
卡 、Flash 等 多 种 存储 设备 中 选择 某 一 种 存储 设备 进行 启动 ) 。 接 下 来 的 18 位 半 字 作为 一 条 指令 执行 ， 它 通常 会 读 取 更 多 的 字 到 主 存 中 。 这 时 开始 执行 Boot 程 序 ， 它 
将 依次 从 外 部 存储 媒质 加 载 更 大 的 程序 到 主 存 中 。 在 1958 年 ，“Boot” 这 个 计算 机 名 词 便 开 始 使 用 了 。 请 读者 注意 ， 这 里 的 “Load” 按键 和 Loader 是 有 本 质 区 别 
的 : “Load” 是 通过 外 部 操作 来 进行 加 载 的 ， 而 Loader 是 软件 实现 的 加 载 器 ， 它 可 以 自行 完成 加 载 的 动作 。 














Boot 这 个 词 的 原意 是 靳 子 ， 那 靳 子 怎么 会 与 计算 机 系统 中 的 引导 发 生 关联 呢 ? 原来 ， 这 里 的 Boot 是 Bootstrap (H) 的 缩写 ， 它 来 自 于 一 句 谚语 : “Pull 
oneself up by one’ s own bootstraps”， 直 译 的 意思 是 “ 搜 着 鞋 带 把 自己 拉 起 来 ”， 这 当然 是 不 可 能 的 事情 。 最 早 的 时 候 ， 工 程 师 用 它 来 做 比喻 ， 比 如 自 举 电路 
振荡 器 (Bootstrap Generator) 就 是 指 ， 不 外 加 激励 信号 而 自行 产生 恒 稳 和 持续 的 振荡 。 对 于 早期 计算 机 的 启动 ， 也 存在 这 样 一 个 问题 : 必须 先 运行 程序 ， 然 后 计 
算 机 才能 启动 ， 但 是 计算 机 不 启动 就 无 法 运行 程序 。 于 是 ， 当 时 的 人 们 想 尽 各 种 办 法 ， 他 们 把 一 小 段 程序 装 进 内 存 ， 之 后 计算 机 就 能 正常 运行 了 。 因 此 ， 工 程 师 们 将 
这 个 过 程 称 为 “ 拉 鞋 带 ”， 久 而 久之 就 简称 为 Boot 了 。 而且 随 着 处 理 器 的 发 展 ，Boot 处 理 的 事务 越 来 越 多 ， 比 如 对 CPU 运行 模式 的 设置 ， 比 如 对 CPU 内 部 时 钟 的 配 
置 ， 还 包括 对 Cache 和 MMU 的 配置 。 






































第 二 个 是 从 存储 技术 的 发 展 来 看 Loader 的 出 现 : 


首先 介绍 两 类 半导体 存储 器 : ROM 和 RAM。ROM 是 Read Only Memory 的 缩写 ，RAM 是 Random Access Memory 的 缩写 。ROM 在 系统 停止 供电 的 时 候 仍然 
可 以 保持 数据 ， 而 RAM 通 常 在 掉 电 之 后 就 丢失 数据 ， 但 是 其 存储 单元 的 内 容 可 按 需 随意 取出 或 存 入 ， 且 存 取 的 速度 与 存储 单元 的 位 置 无 关 。 





ROM 分 为 ROM、PROM、EPROM 和 EEPROM 等 。 只 读 存储 器 (ROM) 是 只 能 读 取 资 料 的 内 存 。 其 资料 内 容 在 写 入 后 就 不 能 更 改 。 此 种 内 存 的 制造 成 本 极 低 ， 
常用 于 电脑 中 的 开机 启动 。 可 编程 只 读 存 储 器 (PROM) 一 般 可 编程 一 次 。PROM 存 储 器 在 出 三 时 各 个 存储 单元 皆 为 1， 或 皆 为 0， 用 户 在 使 用 时 ， 再 采用 编程 的 方法 
使 PROM 存 储 所 需要 的 数据 。 可 擦 除 可 编程 存储 器 (EPROM) 可 多 次 编程 ， 这 是 一 种 便于 用 户 根据 需要 来 写 入 ， 并 能 把 已 写 入 的 内 容 控 去 后 再 改写 ， 即 为 一 种 多 次 
改写 的 ROM。 由 于 能 够 改写 ， 因 此 能 对 写 入 的 信息 进行 校正 ， 修 改 错误 后 再 重新 写 入 。 电 子 可 擦 除 可 编程 只 读 存 储 器 (EEPROM) 的 运作 原理 类 似 于 EPROM ， 但 是 
擦 除 的 方式 更 加 方便 。 








RAM 按 照 存储 单元 的 工作 原理 分 为 静态 随机 存储 器 (SRAM) 和 动态 随机 存储 器 (DRAM) 。SRAM 的 存 取 速 度 要 比 DRAM 快 ， 同 时 价格 也 更 高 。 在 计算 机 中 
SRAM 常 用 来 作为 Cache， 而 DRAM 常 作为 内 存 来 使 用 。 


闪存 (Flash Memory) 是 一 种 高 密度 、 非 易 失 性 的 读 / 写 半导体 存储 器 。 它 既 有 EEPROM 的 特点 ， 又 有 RAM 的 特点 ， 是 一 种 全 新 的 存储 结构 。 Nor Flash 和 
Nand Flash 是 市 场 上 两 种 主要 的 闪存 技术 。Intel 公 司 于 1988 年 首先 开发 出 Nor Flash 技 术 ， 彻 底 改 变 了 原先 由 EPROM 和 EEPROM 一 统 天 下 的 局 面 。 紧 接着 ，1989 
年 ， 东 芝 公 司 发 表 了 Nand Flash 结 构 ， 强 调 降低 每 比特 的 成 本 ， 提 供 更 高 的 性 能 ， 并 且 Nand Flash 像 磁盘 一 样 可 以 通过 接口 轻松 升级 。Nor Flash 和 Nand Flash 有 
几 个 重要 的 区 别 : Nor Flash 带 有 SRAM 接 口 ， 有 足够 的 地 址 引 脚 来 寻 址 ， 可 以 很 容易 地 存 取 内 部 的 每 一 个 字 节 ， 可 以 做 到 芯片 内 执行 (XIP) ， 应 用 程序 可 以 直接 在 
Nor Flash 内 运行 。Nand Flash 使 用 复杂 的 MO 口 来 串 行 地 存 取 数据 ， 并 且 读 写 操作 都 是 块 操作 ， 因 此 它 无 法 做 到 XIP。Neor Flash 的 读 取 速度 比 Nand Flash 稍 快 , 但 
是 写 入 速度 却 要 慢 很 多 。Nand Flash 的 存储 密度 更 高 ， 成 本 更 低 。 因 此 ， 很 多 谋 入 式 单 板 都 使 用 小 容量 的 Nor Flash 来 运行 启动 代码 ， 而 使 用 Nand Flash 存 储 其 他 
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假如 说 当时 已 经 有 一 种 既 可 以 运行 程序 ， 而 且 价格 低廉 、 存 储 空间 大 的 非 易 失 性 存储 的 设备 ， 那 么 我 们 的 所 有 程序 都 可 以 存放 在 此 类 存储 设备 中 ， 这 样 就 不 存在 
加 载 的 问题 了 。 然 而 实际 上 ， 一 般 的 计算 机 系统 都 使 用 多 级 存储 器 层次 结构 ， 既 有 存储 空间 大 、 价 格 低廉 、 运 行 速 度 慢 的 非 易 失 性 存储 设备 (磁盘 ) ， 也 有 空间 小 、 
价格 高 、 运 行 速度 略 快 的 非 易 失 性 存储 设备 (PROM 等 ) ， 还 有 价格 高 ， 运 行 速度 非常 快 的 易 失 性 存储 设备 (RAM) 。 这 样 的 层次 结构 会 保证 硬件 最 佳 的 性 价 比 ， 
然而 从 软件 上 ， 我 们 必须 引入 Loader。 它 将 自动 完成 从 非 易 失 性 存储 设备 向 易 失 性 存储 设备 加 载 程序 的 功能 。 

















在 现实 的 发 展 过程 中 ， 随 着 集成 电路 只 读 存储 器 时 代 的 到 来 ， 由 于 集成 电路 技术 的 发 展 和 ROM 的 出 现 (包括 可 掩 码 编程 的 ROM、 可 编程 的 ROM (PROM) 、 
可 擦 除 可 编程 的 ROM 和 Flash 存 储 器 ) ， 引 导 流 程 发 生 了 极 大 的 改变 。 它 们 使 得 国 件 引导 程序 开始 安装 到 计算 机 中 。 


通常 情况 下 ， 在 上 电 和 复位 的 条 件 下 ， 每 个 微型 处 理 器 会 执行 下 面 两 种 可 能 的 启动 流程 : @ 开 始 执行 从 某 一 特定 地 址 开始 的 代码 ; @ 在 特定 地 址 处 查询 代码 ， 然 
后 跳 转 到 指定 地 址 ， 开 始 执 行 代码 。 运 用 这 种 微 处 理 器 的 系统 使 用 ROM 来 保存 这 些 特定 的 位 置 ， 如 此 ， 系 统 就 不 需要 操作 人 员 的 干预 就 能 开始 运转 。 举 个 例 

F, Intel x86 处 理 器 一 直 从 位 于 FFFF: 0000 的 指令 处 开始 运行 ， 而 MOS 6502 处 理 器 ， 读 取 位 于 $FFFD (MS byte) 和 $FFFC (LS byte) 的 两 个 字 节 长 度 的 向 量 地 
址 ， 然 后 跳 转 到 该 地 址 开始 运行 引导 程序 。 








Apple 的 第 一 代 计 算 机 (1976 年 推出 的 Apple1) 使 用 了 PROM 芯 片 而 不 再 需要 前 面板 的 配置 。 因 此 当时 Apple 的 宣传 广告 是 “No More SwitchesNo More 
Lightshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15768/OEBPS/Text/...the firmware in PROMS 


enables you to enter,display and debug programs (all in hex) from the keyboard” 。 


由 于 当时 只 读 存 储 器 的 造价 很 高 ，Apple 系列 采用 多 种 存储 器 来 构建 存储 器 系统 ， 以 保证 性 能 和 价格 的 最 优化 。 它 使 用 一 串 小 步骤 来 引导 磁盘 上 的 操作 系统 ， 
每 一 个 小 步骤 都 将 控制 权 递 交 到 愈加 复杂 的 引导 流程 中 。 我 们 可 以 预见 ， 每 个 步骤 都 必须 能 控制 下 一 个 步骤 所 用 的 存储 器 的 读 取 操 作 ， 从 而 才能 将 其 内 容 加 载 到 特定 
的 位 置 以 执行 ， 这 样 就 有 了 Loader (加 载 器 ) 的 概念 。 结 合 Boot 和 Loader 的 概念 ，BootLoader 是 既 能 “ 自 举 ”又 能 “举人 ”的 一 段 程序 ， 由 此 ，BootLoader 在 整 
个 计算 机 系统 中 可 以 说 起 着 举足轻重 的 作用 ， 任 何 一 个 计算 机 系统 都 需要 一 个 稳定 强大 的 BootLoader。 








第 三 个 是 从 软件 语言 的 发 展 (特别 是 C 语 言 的 出 现 ) 来 看 BootLoader 的 发 展 : 





最 早 的 计算 机 用 于 读 取 纸 带 的 数据 ， 上 面 记 录 着 二 进 制 格式 的 机 器 指令 ， 计 算 机 每 读 一 条 机 器 指令 就 执行 一 条 机 器 指令 。 机 器 指令 繁多 ， 而 且 不 适合 人 来 阅读 和 
使 用 ， 所 以 后 来 出 现 了 汇编 语言 ， 汇 编 语 言 实质 上 是 机 器 语言 的 助 记 符 。 汇 编 语言 中 出 现 了 函数 的 概念 ， 那 么 在 编写 汇编 代码 时 ， 就 需要 对 栈 进行 小 心 的 设计 ， 并 注 
意 保护 好 上 下 文 现场 。 再 往 后 ， 出 现 了 C 语 言 ，C 语 言 是 一 种 更 抽象 的 语言 ， 它 是 针对 于 程序 员 的 语言 ， 隔 离 了 许多 底层 上 的 概念 ， 比 方 说 隔离 函数 调用 栈 的 设计 。 
并 且 (C 语 言 无 法 完成 很 多 底层 操作 ， 因 为 只 有 汇编 语言 才能 使 用 芯片 架构 上 的 一 些 特殊 的 指令 。 因 此 对 于 BootLoader 来 说 ， 它 是 由 汇编 和 C 语 言 混合 编码 的 ，Boot 中 
的 汇编 代码 完成 只 能 用 汇编 指令 完成 的 操作 ， 并 提供 C 语 言 的 运行 环境 ， 还 需要 对 栈 指 针 和 堆 空 间 进行 初始 化 和 分 配 。C 语 言 的 出 现 无 颖 加快 了 BootLoader 的 设计 和 
开发 ， 从 而 促进 了 BootLoader 的 发 展 。 





第 四 个 是 从 软件 工程 的 角度 来 看 BootLoader 的 发 展 : 


最 初 的 计算 机 软件 统称 为 Firmware， 而 随 着 软件 的 复杂 度 提高 ， 操 作 系统 的 出 现 ， 我 们 相应 地 将 BootLoader 独 立 出 来 ， 并 作为 专门 的 一 个 固件 。BootLoader 
和 操作 系统 分 开设 计 ， 使 得 各 自 的 扩展 性 、 跨 平台 、 可 移植 性 都 大 大 提高 。 另 外 从 软件 工程 的 模块 化 设计 、 分 层 设计 来 讲 ， 像 UBoot 这 样 的 BootLoader 的 设计 越 来 
越 像 Linux 了 ， 其 代码 布局 和 Linux 十 分 类 似 ， 使 用 了 按照 模块 划分 的 结构 ， 并 且 充 分 考虑 了 体系 结构 和 跨 平台 问题 。 





1.3 ”BootLoader 的 概念 


这 一 节 我 们 全 面 地 介绍 BootLoader 的 基本 概念 。 


简单 地 说 ，BootLoader 就 是 在 操作 系统 内 核 运 行 前 执行 的 一 段 小 程序 。 通 过 这 段 小 程序 ， 可 以 对 硬件 设备 ， 如 CPU、SDRAM、Flash、 串 口 等 进行 初始 化 ， 也 
可 以 下 载 文件 到 系统 板 、 对 Flash 进 行 擦 除 和 编程 ， 真 正 起 到 加 载 和 引导 内 核 镜像 的 作用 。 但 是 随 着 嵌入 式 系统 的 发 展 ，BootLoader 已 经 逐渐 在 上 述 基 本 功能 的 基础 
上 进行 了 扩展 ，BootLoader 可 以 增加 更 多 的 对 具体 系统 的 板 级 支持 ， 即 增加 一 些 硬 件 模块 功能 上 的 使 用 支持 ， 以 方便 开发 人 员 进 行 开发 和 调试 。 























从 这 个 层面 上 看 ， 功 能 扩展 后 BootLoader 可 以 虚拟 地 看 成 一 个 微小 的 系统 级 的 代码 包 。BootLoader 是 依赖 于 硬件 实现 的 ， 特 别 是 在 嵌入 式 系统 中 。 不 同 的 体系 
结构 下 ， 对 BootLoader 的 需求 是 不 同 的 ; 除了 体系 结构 ，BootLoader 还 依赖 于 具体 的 嵌入 式 板 级 设备 的 配置 。 也 就 是 说 ， 对 于 两 块 不 同 的 嵌入 式 电 路 板 而 言 ， 即 使 
它们 基于 相同 的 CPU 构建 ， 运 行 在 其 中 一 块 电路 板 上 的 BootLoader， 都 未 必 能 够 运行 在 另 一 块 电路 板 上 。 


当 现代 的 计算 机 关机 时 ， 它 的 软件 ， 包 括 操作 系统 、 应 用 程序 和 数据 ， 都 会 存放 在 非 易 失 性 存储 设备 上 ， 比 如 硬盘 、CD、DVD、Flash 存 储 卡 (SDF) 、USB 
盘 和 软盘 。 当 计算 机 上 电 时 ， 在 它 的 RAM 中 是 没有 操作 系统 和 加 载 器 的 。 计 算 机 会 首先 执行 存放 在 ROM 中 的 相对 较 小 的 程序 ， 读 取 小 容量 的 必需 数据 ， 这 样 才能 访 
问 非 易 失 性 存储 设备 中 的 操作 系统 和 数据 ， 并 将 其 加 载 到 RAM 中 。 





这 个 过 程 中 的 小 程序 被 称 为 “Bootstrap Loader” “Bootstrap” EÈ “Boot Loader”。 这 段 小 程序 的 目的 是 加 载 其 余 的 数据 和 程序 到 RAM 中 并 开始 执行 。 若 使 
用 多 阶段 的 Boot Loader， 它 们 会 一 个 接 一 个 的 加 载 。 


有 一 些 计算 机 系统 ， 当 从 操作 人 员 或 者 外 设 接 到 一 个 引导 信号 后 ， 会 加 载 少 量 的 固定 指令 到 内 存 中 的 特定 地 址 ， 初 始 化 至 少 一 个 CPU， 然 后 让 CPU 开始 执行 这 些 


指令 。 这 些 指令 通常 会 对 一 些 外 围 设 备 做 输入 操作 。 有 一 些 系统 会 向 外 围 设 备 或 者 /O 控 制 器 直接 发 送 硬件 命令 来 进行 非常 简单 的 输入 操作 ， 加 载 一 小 部 分 Boot 
Loader 指 令 到 内 存 中 ，MO 设 备 的 一 个 信号 会 通知 CPU 开始 执行 指令 。 





小 型 的 计算 机 经 常 使 用 不 那么 灵活 但 是 更 自动 化 的 Boot Loader 机 制 来 保证 计算 机 在 预定 的 软件 配置 下 能 够 快速 启动 。 在 很 多 桌面 型 计算 机 中 ， 比 如 ， 在 
ROM (IBM PC 的 BIOS) 的 预定 义 地 址 中 有 一 软件 (有 一 些 CPU， 包 括 Intel 的 x86 系 列 ， 在 复位 后 无 需 外 部 的 辅助 就 可 以 执行 这 个 软件 ) ， 这 个 软件 有 查找 booting 
过 程 中 用 到 的 设备 的 基本 功能 ,然后 从 设备 的 特定 部 分 (通常 是 boot sector) 加 载 一 个 小 程序 。 


Boot Loader 会 有 一 些 特殊 的 约束 ， 特 别 是 大 小 。 比 如 ， 在 IBM PC 和 其 兼容 机 上 ， 引 导 扇 区 只 能 是 系统 存储 中 的 32KB (后 来 扩充 到 64KB) ， 而 且 不 能 使 用 
8088/8086 处 理 器 不 支持 的 指令 。 


BootLoader 的 启动 过 程 可 以 是 单 阶段 的 ， 也 可 以 是 多 阶段 的 。 通 常 多 阶段 的 BootLoader 能 提供 更 为 复杂 的 功能 ， 以 及 更 好 的 可 移植 性 。 从 固态 存储 设备 上 启动 
的 BootLoader 大 多 数 是 二 阶段 的 启动 过 程 ， 即 启动 过 程 可 以 分 为 stage1 和 stage2 两 部 分 。 








第 二 阶段 的 BootLoader， 比 如 GNU GRUB、BOOTMGR、Syslinux、NTLDR 或 者 BootX， 能 够 正确 加 载 操作 系统 并 移交 控制 权 ; 接着 操作 系统 会 进行 一 系列 初 
始 化 并 可 能 加 载 额 外 的 设备 驱动 。 第 二 阶段 的 goot Loader 在 自己 的 操作 过 程 中 不 需要 驱动 ， 但 是 需要 由 系统 固件 (比如 BIOS 或 者 Open Firmware) 提供 通用 存储 
访问 方法 ， 然 而 这 样 会 限制 硬件 的 功能 ， 降 低 其 性 能 。 











很 多 Boot Loader (比如 GNU GRUB、Window 的 BOOTMGR 和 Windows NT/2000/XP 的 NTLDR) 能 够 为 用 户 提供 多 个 引导 选项 。 这 些 选 项 可 以 是 多 个 不 同 的 
操作 系统 (不 同 分 区 或 者 不 同 驱动 器 上 的 多 个 引导 ) ， 也 可 以 是 同一 操作 系统 的 不 同 版 本 ， 还 可 以 是 同一 操作 系统 的 不 同 加 载 选 项 (比如 说 进入 恢复 模式 或 者 安全 模 
式 ) ， 甚 至 可 以 是 一 些 不 是 操作 系统 的 独立 程序 ， 比 如 内 存 测试 程序 (memtest86+) 。 有 一 些 BootLoader 会 加 载 其 他 的 BootLoader， 比 如 GRUB 不 会 直接 加 载 
Windows， 而 是 加 载 BOOTMGR。 通 常 有 一 个 倒计时 选择 可 以 让 用 户 通过 按键 来 进行 选择 。 倒 计时 结束 后 ， 默 认 的 选择 是 自动 运行 正常 的 引导 程序 。 














当 计算 机 能 够 与 用 户 交互 时 ， 或 者 操作 系统 能 够 运行 系统 程序 和 应 用 程序 时 ， 引 导 流 程 可 以 看 成 结束 了 。 通 常 现代 的 个 人 计算 机 在 1min 以 内 完成 引导 ， 其 中 15s 
用 于 上 电 自 检 和 初步 3 引导 ， 剩 下 的 时 间 用 于 加 载 操作 系统 和 其 他 软件 。 操 作 系统 加 载 完成 后 花费 的 时 间 可 以 缩短 至 3s， 仅 仅 只 是 启动 核心 的 服务 。 而 大 型 服务 器 可 能 
需要 数 分 钟 来 引导 和 启动 服务 。 

很 多 嵌入 式 系 统 必须 非常 迅速 地 完成 引导 。 比 如 说 ， 花 一 分 钟 来 等 待 数字 电视 或 者 GPS 设 备 的 启动 是 不 被 用 户 接 受 的 。 因 此 这 类 设备 在 ROM 或 者 Flash 中 有 特殊 
的 软件 系统 ， 使 得 设备 更 快速 地 启动 ， 几 乎 不 需要 加 载 ， 因 为 在 生产 设备 的 时 候 加 载 的 内 容 已 预先 存在 ROM 中 了 。 


其 他 类 型 的 引导 顺序 如 下 。 








一 些 现 代 的 CPU 和 微 处 理 器 (例如 TI OMAP) ， 甚 至 一 些 DSP 在 它们 的 芯片 中 含有 已 经 烧 录 好 引导 代码 的 引导 ROM ， 那 么 这 样 的 处 理 器 能 够 执行 相当 复杂 的 引 
导 流 程 ， 比 如 它 能 够 从 Nand Flash、SD 或 MMC 卡 等 多 种 存储 设备 引导 。 由 于 很 难 用 电路 逻辑 来 处 理 这 些 设备 ， 那 么 这 种 情况 下 就 使 用 集成 的 引导 ROM。 引 导 ROM 
能 够 提供 比 硬件 逻辑 更 灵活 的 引导 顺序 。 比 如 ， 引 导 ROM 能 够 试 着 从 多 个 引导 源 设备 执行 引导 过 程 。 另 外 ， 引 导 ROM 也 能 够 从 串口 ， 比 如 UART、SPI| 或 者 USB 等 接 
口 来 加 载 BbootLoader 或 者 诊断 程序 。 当 存放 在 非 易 失 性 存储 中 的 引导 程序 被 擦 除 时 ， 这 个 特性 可 以 用 来 恢复 系统 ， 而 且 当 系统 中 的 非 易 失 性 存储 中 没有 程序 可 用 
时 ， 也 可 以 对 非 易 失 性 存储 进行 编程 。 


























有 些 嵌 入 式 系 统 可 能 包含 中 间 的 引导 流程 步骤 ， 由 内 建 的 引导 ROM 加 载 到 系统 RAM 中 。 由 于 平台 的 限制 ， 比 如 说 RAM 大 小 的 限制 ， 需 要 加 一 个 中 间 的 引导 流程 
步骤 ， 比 如 Das U-Boot， 它 就 有 SPL 的 架构 : 由 SPL 引 导 U-Boot， 接 着 U-Boot 引 导 系 统 。 


我 们 有 时 会 使 用 硬件 的 调试 接口 ， 比 如 JTAG (JTAG 是 一 个 标准 的 流行 接口 ， 许 多 CPU 和 微 处 理 器 都 带 有 JTAG 接 口 ) 来 控制 系统 。 这 类 调试 接口 可 以 用 于 向 可 引 
导 的 非 易 失 性 存储 设备 中 烧 写 Boot Loader 代 码 。 另 外 ， 这 类 调试 接口 可 以 用 于 加 载 一 些 诊断 或 者 引导 代码 到 RAM 中 ， 并 且 使 得 处 理 器 开始 执行 代码 。 当 可 引导 的 存 
储 设备 没有 程序 时 ， 它 可 以 用 于 恢复 嵌入 式 系统 ， 也 可 以 用 于 不 含有 内 建 引导 ROM 的 处 理 器 。 











有 些微 处 理 器 包 合 不 能 获取 系统 控制 权 或 者 直接 运行 代码 的 特殊 硬件 接口 ， 但 是 它们 通过 一 些 简 单 的 协议 可 以 将 引导 代码 注入 非 易 失 性 存储 设备 中 。 那 么 在 生产 
过 程 中 ， 使 用 这 类 接口 向 非 易 失 性 存储 中 注入 引导 代码 。 当 系统 复位 后 ， 微 处 理 器 开始 执行 非 易 失 性 存储 中 的 代码 ， 就 像 使 用 OM 引 导 一 样 。Atmel AVR 微 处 理 器 
就 使 用 了 该 项 技术 。 很 多 情况 下 这 类 接口 都 是 由 硬件 逻辑 设计 的 。 另 外 的 一 些 情况 下 ， 这 类 接口 可 以 通过 配置 GPIO 运 行内 建 的 引导 ROM 中 的 代码 来 创建 。 

















大 多 数 DSP 有 一 个 串 行 模式 的 引导 和 一 个 并 行 模式 的 引导 。 在 DSP 中 ， 系 统 设计 中 通常 有 一 个 微 处 理 器 ， 它 负责 所 有 的 系统 行为 、 中 断 处 理 、 外 部 事件 和 用 户 接 
口 等 。 而 DSP 只 专注 信号 处 理 。 在 这 类 系统 中 ，DSP 被 其 他 的 处 理 器 引导 。 这 个 处 理 器 被 称 为 主 处 理 器 (Host Processor) ， 有 时 候 也 被 称 为 主机 ， 因 为 它 首 先 从 自 
己 的 存储 中 引导 ， 接 着 控制 所 有 的 系统 行为 ， 包 括 引 导 DSP， 最 后 控制 DSP 的 运行 。DSP 的 引导 内 存 通常 很 小 ， 而 且 依 赖 于 主 处 理 器 。 用 于 手机 、 调 制 解 调 器 、 音 视 
频 播放 器 等 设备 的 系统 都 是 这 么 设计 : DSP 和 CPU 一 体 化。 另外 ， 很 多 FPGA 芯 片 在 上 电 时 从 外 部 的 EEPROM 中 加 载 配置 (配置 ROM) 。 














我 们 较为 全 面 地 介绍 了 BootLoader 的 概念 和 发 展 。 随 着 计算 机 技术 的 发 展 ，BootLoader 这 个 新 名 词 开 始 被 使 用 ， 并 且 它 的 定位 越 来 越 清晰 ， 功 能 也 越 来 越 多 ， 
越 来 越 强 。 细 心 的 读者 可 能 还 发 现 了 ， 我 们 对 存储 技术 的 讲解 比 对 CPU 技 术 的 讲解 要 多 ， 这 是 因为 系统 的 存储 架构 对 BootLoader 设 计 的 影响 比 CPU 的 影响 要 大 许 
多 。 现 在 我 们 将 发 展 过 程 缩 略 如 图 1-1 所 示 ， 其 中 反映 了 几 种 不 同体 系 下 的 BootLoader。 虽 然 复杂 程度 相差 许多 ， 但 是 本 质 是 一 致 的 : 都 是 先 引 导 再 进行 加 载 。 下 面 
一 小 节 介 绍 BootLoader 的 概念 ， 并 对 MCU 下 的 BootLoader、 许 入 式 ARM 和 Linux 下 的 BootLoader 和 PC 下 的 引导 流程 的 异同 做 了 一 个 概述 。 
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图 1-1 不 同体 系 下 的 BootLoader 


1.4 本章 小 结 


本 章 首先 从 4 个 不 同 的 角度 来 叙述 BootLoader 的 由 来 和 发 展 过 程 ， 进 而 阐述 BootLoader 的 概念 。 在 对 BootLoader 有 了 初步 认识 以 后 ， 抛 出 一 些 掌握 
BootLoader 概 念 所 必须 理解 的 技术 细节 ， 而 这 些 技术 细节 将 在 后 续 几 章 中 慢 慢 铺 开 讲述 。 


第 2 章 ”Linux 开 发 环境 


“ 工 欲 善 其 事 ， 必 先 利 其 器 。” 既 然 是 开发 典 入 式 Linux 下 的 BootLoader， 那 么 必须 选择 合适 的 编辑 器 和 编译 器 加 以 熟练 使 用 。 
我 们 选用 的 编辑 器 是 Linux 下 流行 的 编辑 器 Vim ， 编 译 器 是 Linux 下 最 流行 的 GCC 编译 器 和 arm-linux-gcc 交 叉 编 译 器 。 开 发 嵌入 式 Linux 下 的 BootLoader 使 用 的 
语言 是 汇编 语言 和 人 语言， 汇编 语言 和 C 语 言 都 是 最 早 开 发 出 来 的 编译 型 语言 ， 基 于 这 两 种 语言 编写 的 程序 在 执行 之 前 都 需要 编译 器 将 代码 编译 为 机 器 码 的 二 进 制 文 


件 才能 运行 。 








最 后 ， 对 于 在 Linux 下 阅读 和 开发 BootLoader 这 样 的 工程 ， 也 必须 对 Linux 下 的 shell 脚 本 以 及 工程 管理 工具 Make 做 一 些 学 习 。 


2.1 节 介绍 嵌入 式 Linux 下 最 流行 的 常用 编辑 器 Vim 的 基本 使 用 。 


2.2 节 介绍 GNU 编 译 器 套件 GCC 和 适用 于 ARM 体 系 结构 的 交叉 编译 器 。 
2.3 节 介绍 常用 shell 命 令 以 及 简单 shell 脚 本 的 写法 。 


2.4 节 介绍 Linux 下 强大 的 工程 管理 工具 Make 和 Makefile。 


2.1 编辑 器 Vim 





圈 内 有 一 种 说 法 : 世界 上 有 三 种 程序 员 ， 一 种 用 Emacs， 一 种 用 Vi， 剩 下 的 使 用 其 他 编辑 器 。Emacs 号 称 是 “ 神 的 编辑 器 ”， 而 Vim 是 “编辑 器 之 神 ”; 这 么 说 
是 有 群众 基础 和 道理 的 ， 谁 用 谁 知 道 。 其 实 ， 莹 卜 青 菜 ， 各 种 所 爱 ， 习 惯 就 好 。Vi 的 设计 采用 了 UNIX 传 统 的 设计 哲学 一 一 “do one thing and do it well” , 而且 
通过 Vim 脚 本 无 限 地 扩展 功能 ， 使 其 成 为 了 编辑 器 中 的 “神器 ”。 











2.2 ”编译 器 GCC 和 交叉 编译 器 


2.2.1 GCC 的 编译 流程 


GCC (GNU Compiler Collection，GNU 编 译 器 套装 ) 是 一 套 由 GNU 开 发 的 编程 语言 编译 器 ， 它 是 一 套 基于 GPL 及 LGPL 许 可 证 所 发 布 的 自由 软件 ， 也 是 GNU 
计划 的 关键 部 分 ， 亦 是 类 UNIX 操 作 系 统 及 苹果 Mac OS X 操 作 系 统 的 标准 编译 器 。GCC (特别 是 其 中 的 C 语 言 编译 器 ) 常 被 认为 是 跨 平台 编译 器 的 事实 标准 。 


最 初学 习 编程 时 都 使 用 DE， 写 好 代码 后 单 击 Build 按 钮 然后 就 开始 编译 链接 最 终 的 可 执行 程序 了 ， 非 常 的 方便 快捷 ， 但 是 这 些 IDE 屏 蔽 了 许多 编译 链接 的 过 程 细 
节 。 而 当 我 们 在 嵌入 式 Linux 平 台 下 做 开发 时 ， 经 常会 遇 到 编译 和 链接 出 现 问题 ， 所 以 需要 我 们 关注 编译 和 链接 的 细节 。 深 入 理解 了 编译 链接 的 原理 和 机 制 ， 就 能 
游 思 有 余地 解决 这 些 问题 了 。 甚 至 可 以 说 ， 命 令 选项 是 深入 理解 编译 链接 的 第 一 步 。 





在 Linux 下 ， 不 理解 编译 链接 ， 就 没 办 法 真正 学 习 掌 握 BootLoader。 而 本 章 了 解 编译 器 GCC 的 使 用 步骤 。 当 我 们 使 用 GCC 编译 程序 时 ， 只 需 使 用 最 简单 的 命 
"gcc test.c” 生 成 可 执行 文件 ， 上 默认 的 文件 名 是 a.out。 


“> 


然而 ， 上 述 一 条 命令 可 以 分 为 四 个 步 又， 分 别 是 预 处 理 、 编 译 、 汇 编 和 链接 。 


第 一 步 预 处 理 的 过 程 相当 于 如 下 命令 (-E 表 示 只 进行 预 编 译 ) : 


gcc -E test.c -o test.i 


预 处 理 的 主要 作用 就 是 通过 预 处 理 的 内 建功 能 对 一 个 资源 进行 等 价 替 换 。 最 常见 的 比如 文件 包含 、 条 件 编译 和 宏 蔡 换 。 





第 二 步 编译 过 程 就 是 把 预 处 理 的 文件 进行 一 系列 词法 分 析 、 语 法 分 析 、 语 义 分 析 及 优化 生成 相应 的 汇编 代码 文件 ， 这 个 过 程 是 通常 所 说 的 整个 程序 构建 的 核心 部 
分 ， 也 是 最 复杂 的 部 分 之 一 。 编 译 过 程 相 当 于 如 下 命令 : 


gcc -S test.i -o test.s 


第 三 步 汇编 器 将 汇编 代码 转 为 机 器 码 ， 每 一 个 汇编 语句 几乎 都 对 应 着 一 条 机 器 指令 。 汇 编 过 程 可 以 用 如 下 的 命令 : 


gcc -c test.s -o tést.io 


这 个 阶段 GCC 实际 调用 了 另 一 个 程序 as 完成 汇编 工作 。 


第 四 步 链接 是 编译 的 最 后 一 个 阶段 ， 它 将 各 个 目标 文件 链接 起 来 ， 生 成 可 执行 文件 。 其 命令 如 下 所 示 : 


gcc test.o -o test 


在 这 个 阶段 GCC 实际 调用 了 另 一 个 程序 ld 完成 链接 工作 。 


通常 在 实际 的 编译 中 并 不 用 一 步 步 来 执行 ， 一 般 都 使 用 如 下 命令 : 





gcc test.c -o test 


2.3 ”常用 shell 命 令 和 脚本 


作为 Linux 来 源 的 UNIX 系 统 最 初 根本 就 没有 图 形 化 界面 ， 所 有 的 任务 都 是 通过 命令 行 来 完成 。 因 此 UNIX 下 的 命令 行 系统 得 到 了 很 大 的 发 展 ， 并 且 成 为 一 个 功能 
强大 的 系统 。Linux 系 统 继承 了 这 一 特点 ， 许 多 强大 的 功能 都 可 以 从 shell 中 轻松 实现 。shell 非 常 强大 ， 以 至 于 有 许多 书 专门 介绍 shell 脚 本 。 这 里 我 们 假定 读者 了 解 
shell 中 常用 的 基本 命令 和 脚本 文件 的 编写 格式 。 





本 节 我 们 将 介绍 在 阅读 代码 时 经 常用 到 的 两 个 特别 有 用 的 命令 行 工 具 : find 和 grep; 还 将 介绍 体现 Linux 设 计 哲 学 的 管道 和 重 定向 的 概念 。 





2.4 ”工程 管理 Make 和 Makefile 


一 个 软件 工程 通常 会 包含 成 百 上 干 个 文件 ， 如 果 每 次 编译 都 通过 命令 行 手动 编译 或 是 写 一 个 批 处 理 脚 本 对 其 进行 编译 ， 往 往 很 麻烦 而 县 效率 较 低 。Windows 下 
有 许多 软件 开发 的 IDE 工 具 ，1IDE 工 具 中 都 有 工程 的 概念 。 新 建 了 工程 以 后 ，1DE 工 具 会 自动 维护 其 中 的 各 种 文件 ， 无 论 是 添加 、 删 除 或 是 修改 文件 ， 都 能 根据 需要 对 
工程 文件 进行 处 理 并 高 效 地 完成 编译 工作 。 举 个 例子 ， 比 如 跨 平台 的 Qt， 新 建 一 个 Qt 的 工程 后 都 会 生成 一 个 以 .pro 为 后 缀 的 工程 文件 ， 这 个 工程 文件 定义 了 该 工程 使 
用 了 哪些 基本 的 库 、 包 含 的 头 文件 和 C++ 源 文件 等 。Qt 有 内 部 的 工具 根据 工程 文件 生成 Makefile 文 件 ， 最 后 根据 生成 的 Makefile 文 件 进行 编译 链接 。 如 果 不 接触 类 
似 Qt 这 样 跨 平台 的 工具 ， 使 用 Windows 下 的 IDE 可 能 无 需 关 心 工 程 到 底 是 如 何 组 织 维护 的 ， 只 需要 单 击 Build 等 几 个 按键 即 可 。 而 跨 平 台 的 Qt 使 用 了 UNIX/Linux 下 的 
功能 强大 、 使 用 方便 的 工程 管理 工具 ， 这 就 是 Make 和 Makefile。 其 实 ，Windows 下 大 多 数 的 IDE 都 有 Make 这 个 命令 ， 比 如 Delphi 的 make、Visual C++ 的 
nmake， 只 是 它们 都 深 深 地 被 IDE 隐 藏 了 起 来 。 





Linux 程 序 员 如 果 不 会 使 用 Make 工 具 以 及 通过 编写 Makefile 文 件 来 构建 和 管理 自己 的 工程 ， 那 么 就 不 能 算 一 个 专业 的 Linux 程 序 员 。 通 过 Make 工 具 能 够 比较 容 
易 地 构建 一 个 属于 自己 的 工程 ， 只 需要 一 个 命令 就 可 以 完成 编译 链接 以 及 最 后 的 执行 。 它 极 大 地 提高 了 实际 项 目的 工作 效率 ， 几 乎 所 有 的 Linux 下 的 项 目 都 会 使 用 
它 ， 尤 其 在 做 BootLoader 和 内 核 移植 时 ， 在 很 多 情况 下 就 是 阅读 各 层级 的 Makefile 并 修改 配置 。 在 阅读 优秀 开源 代码 的 学 习 过 程 中 ， 第 一 步 就 是 阅读 Makefile， 从 
全 局 把 握 整个 代码 结构 。 可 以 说 Makefile 是 分 析 和 构建 大 型 工程 的 必 备 知识 ， 是 分 析 大 型 工程 的 入 口 点 ， 是 构建 大 型 工程 的 利器 。 在 实际 项 目 开 发 中 ， 能 不 能 构建 整 
个 项 目的 Makefile， 从 侧面 反映 了 一 个 人 对 整个 项 目的 理解 程度 和 其 个 人 是 否 具备 完成 大 型 工程 的 能 力 。 














2.5 ”本章 小 结 


本 章 介 绍 了 Linux 下 的 开发 环境 ， 包 括 编辑 器 Vim、 编 译 器 GCC、shell 脚 本 以 及 工程 管理 工具 Make， 其 中 的 每 一 项 都 值得 用 一 本 书 来 详尽 地 讲述 。 这 里 仅仅 给 
出 它们 的 基本 用 法 ， 请 读者 在 学 习 过 程 中 加 强 实践 ， 加 强 对 用 法 的 扩展 学 习 ， 并 熟练 地 运用 在 BootLoader 的 开发 学 习 中 。 





第 3 草 ”ARM 体系 结构 


本 章 导 读 

ARM 是 一 款 RISC 处 理 器 ， 因 此 它 集 成 了 以 下 典型 的 RISC 架 构 的 特性 : 
“ 数量 很 多 的 通用 寄存 器 。 
+ 使 用 load/store 的 体系 结构 操作 寄存 器 中 的 数据 ， 而 不 直接 操作 内 存 中 的 数据 。 
“ 简单 的 寻 址 模式 ， 所 有 的 load/store 地 址 都 由 寄存 器 内 容 和 指令 格式 决定 。 
: 采用 统一 固定 长 度 的 指令 格式 来 简化 指令 的 译 码 。 

除 此 之 外 ，ARM 体 系 结构 还 提供 一 些 独特 的 特性 : 
: 在 绝 大 多 数 数据 处 理 指令 中 包含 算术 逻辑 和 移 位 逻辑 ， 最 大 化 的 高 效 利 用 ALU 和 移 位 器 。 
- 使 用 自 增 和 自 减 的 地 址 模式 来 优化 程序 循环 处 理 。 


- load/store 指 令 可 以 批量 传输 数据 ， 从 而 提高 数据 传输 的 效率 。 


+ 几乎 所 有 的 指令 都 可 以 条 件 执行 ， 从 而 提高 指令 执行 效率 。 

这 些 在 基本 RISC 体 系 上 的 增强 属性 使 得 ARM 处 理 器 在 性 能 、 小 的 代码 体积 、 功 耗 和 硅 片 面积 几 方面 取得 极 佳 的 平衡 。 
3.1 节 介绍 ARM 的 几 种 处 理 器 模式 。 

3.2 节 介绍 ARM 处 理 器 的 异常 模式 。 

3.3 节 介绍 ARM 下 的 寄存 器 构成 。 

3.4 节 紧 接着 详细 介绍 ARM 下 的 通用 寄存 器 。 


3.5 节 介绍 ARM 下 的 程序 状态 寄存 器 。 


3.1 处理 器 模式 


ARM 处 理 器 支持 表 3-1 中 的 7 种 处 理 器 模式 。 


表 3-1 ARM 处理 器 模式 


处 理 器 模式 描述 

User 普通 的 程序 执行 模式 

FIQ 支持 快速 的 数据 搬移 或 通道 处 理 

IRQ 用 于 通用 的 中 断 处 理 

Supervisor 用 于 操作 系统 的 保护 模式 

Abort 虚拟 存储 或 存储 保护 

Undefined 支持 硬件 协 处 理 器 的 软件 仿真 

System 运行 享有 特权 的 操作 系统 任务 
通过 软件 操作 及 外 部 的 中 断 或 异常 处 理 可 以 切换 模式 。 


大 多 数 应 用 程序 在 用 户 模式 下 执行 。 当 处 理 器 处 于 用 户 模式 时 ， 正 在 执行 的 程序 不 能 访问 保护 的 系统 资源 和 切换 模式 ， 除 非 有 异常 产生 。 操 作 系统 正 是 利用 这 个 
特性 来 控制 系统 资源 使 用 的 。 


除 用 户 模 式 ， 其 他 的 模式 都 是 特权 模式 。 它 们 可 以 完全 访问 系统 资源 和 自由 切换 模式 ， 其 中 的 5 种 又 称 为 异常 模式 : 

- FIQ 

- IRQ 

- Supervisor 

+ Abort 

- Undefined 

当 发 生 特定 的 异常 时 ， 处 理 器 就 会 进入 相对 应 的 模式 中 。 每 一 种 模式 都 有 额外 的 寄存 器 使 其 不 影响 原先 的 用 户 模式 状态 。 


最 后 一 种 模式 叫做 系统 模式 ， 它 不 是 由 异常 进入 的 ， 而 且 它 与 用 户 模式 有 完全 一 样 的 寄存 器 。 但 它 还 是 一 种 特权 模式 ， 并 没有 用 户 模式 的 限制 。 这 种 模式 在 操作 
系统 任务 需要 访问 系统 资源 ， 但 是 不 希望 使 用 其 他 异常 模式 的 额外 寄存 器 时 使 用 。 
3.2 FF 


ARM 支 持 7 种 异常 类 型 ， 每 种 类 型 都 有 其 特权 处 理 模式 。 这 7 种 异常 类 型 是 : 


“ 重启 异常 


ROP LH R 

+ 数据 中 止 异常 

:中断 异常 

` 快速 中 断 异 党 

由 内 部 源 或 外 部 源 产 生 的 异常 引起 处 理 器 处 理 一 个 事件 ， 比 如 外 部 产生 的 中 断 或 者 试图 执行 一 条 未 定义 指令 。 处 理 异常 之 前 的 处 理 器 模式 通常 会 保存 ， 这 样 当 异 
常 处 理 完成 后 就 会 恢复 原先 的 程序 。 同 一 时 间 可 以 出 现 多 个 异常 。 

ARM 体 系 结构 支持 7 种 异常 ， 表 3-2 列 出 了 异常 类 型 和 其 对 应 的 处 理 器 模式 。 当 异常 发 生 时 ， 程 序 强制 跳 转 到 异常 对 应 的 地 址 。 这 些 固定 的 地 址 称 为 异常 向 量 。 


表 3-2 ”异常 处 理 模式 


指令 未 定义 异常 0xFFFF0004 
指令 预 取 异常 0xFFFF000C 
数据 访问 异常 0xFFFF0010 
ET ORFFFROIC 


当 异 常 发 生 时 ,一些 寄存 器 就 由 异常 模式 下 的 相应 寄存 器 取代 。 所 有 异常 模式 都 有 替代 的 寄存 器 R13 和 R14。 快 速 中 断 模式 还 有 用 于 快速 中 断 处 理 的 额外 的 寄存 
器 。 





当 进 入 异常 处 理 程序 中 时 ，R14 保 存 异 常 处 理 的 返回 地 址 。 
R13 为 每 种 异常 处 理 保存 私有 的 栈 指针 ， 快 速 中 断 模式 还 有 自己 的 R8~R12 可 用 ， 所 以 中 断 处 理 程序 无 须 备份 这 些 寄存 器 。 


第 六 种 特权 处 理 模 式 一 一 系统 模式 也 使 用 用 户 模式 的 寄存 器 。 它 用 于 运行 需要 访问 存储 系统 和 协 处 理 器 权限 的 任务 。 





33 ARM 寄存 器 


ARM 处 理 器 共有 37 个 寄存 器 : 
* 31 个 通用 寄存 器 : 包括 一 个 程序 计数 器 在 内 。 这 些 寄存 器 是 32 位 大 小 的 。 


“6 个 状态 寄存 器 : 这 些 寄存 器 同样 是 32 位 大 小 的 ， 但 是 只 有 32 位 中 的 部 分 会 分 配 或 者 需要 执行 。 








所 有 的 寄存 器 编排 为 有 部 分 重 亚 的 分 组 ， 由 当前 的 处 理 器 模式 决定 使 用 哪 一 个 分 组 。 在 任何 时 候 ，15 个 通用 寄存 器 (RO~R14) ， 一 个 或 两 个 状态 寄存 器 和 程序 
计数 器 是 可 见 的 。 图 3-1 所 示 的 每 一 列 显示 在 指定 处 理 器 模式 下 的 那些 通用 寄存 器 和 状态 寄存 器 是 可 见 的 。 





Privileged modes 特权 模式 > 
Exception modes 异常 模式 


Supervisor 


超级 用 户 模式 








CPSR CPSR CPSR CPSR CPSR CPSR CPSR 
| | psRsve |SPSR abt |SPSRund |SPSR irqy |SPSR fiq 


TE: 黑体 的 寄存 器 表明 在 用 户 模式 和 系统 模式 下 的 普通 寄存 器 被 异常 模式 下 对 应 的 寄存 器 所 取代 。 


图 3-1 寄存 器 组 成 结构 


3.4 通用 寄存 器 


通用 寄存 器 RO~R15 可 以 分 为 如 下 三 组 : 
“ 未 分 组 的 寄存 器 : RO~R7 
- 分 组 的 寄存 器 : R8~R14 


<- R15: PC 


3.5 程序 状态 寄存 器 


当前 程序 状态 寄存 器 (CPSR) 在 所 有 处 理 器 模式 下 都 是 可 访问 的 ， 它 包括 条 件 标志 位 、 中 断 禁 止 位 、 当 前 处 理 器 模式 控制 以 及 其 他 状态 和 控制 位 。 每 种 异常 模 
式 都 有 一 个 保存 程序 状态 寄存 器 (SPSR) ， 当 异常 发 生 时 用 于 保持 CPSR 的 值 。 


注意 : 


Uset 模 式 和 System 模式 都 没有 SPSR， 因 为 它们 都 不 是 异常 模式 。 在 Usetr 模 式 和 System 模式 下 读 写 SPSR 都 会 引起 不 可 预料 的 结果 


CPSR 和 SPSRs 的 格式 如 图 3-2 所 示 。 


31 30 29 28 27 26 25 24 23 20 19 16.15 10:9 8.7 6.5 





图 3-2 程序 状态 寄存 器 格式 


3.6 ”本章 小 结 


本 章 通 过 讲解 ARM 的 处 理 器 模式 、 异 常 类 型 以 及 寄存 器 来 描述 ARM 体 系 结构 。 掌 握 ARM 体 系 结构 一 方面 能 对 中 断 、 复 位 异常 等 加 深 理解 ， 另 一 方面 理解 处 理 器 
核 的 体系 结构 是 熟悉 对 应 BootLoader 必 不 可 缺 的 部 分 。 


第 4 齐 ARM 指 令 集 


本 章 导读 


由 于 ARM 本 身 是 一 款 RISC 处 理 器 内 核 ， 其 指令 集 有 着 自己 的 特性 。 





ARM 指 令 集 分 为 下 面 几 个 大 类 : 数据 处 理 指令 、 分 支 指令 、 软 中 断 指令 、 程 序 状态 寄存 器 指令 、 协 处 理 器 指令 和 加 载 常量 的 伪 指 令 。 
4.1 节 介绍 数据 处 理 指令 。 

4.2 节 介绍 分 支 指令 。 

4.3 节 介绍 软 中 断 指令 。 

4.4 节 介绍 程序 状态 寄存 器 指令 。 


4.5 节 介绍 协 处 理 器 指令 。 





4.6 节 介绍 加 载 常量 的 伪 指 令 。 


4.1 数据 处 理 指令 








数据 处 理 指令 操作 寄存 器 中 的 数据 ， 它 又 可 以 细 分 为 移动 指令 、 算 术 指 令 、 逻 辑 运算 指令 、 比 较 运算 指令 和 乘法 指令 。 大 多 数 数据 指令 可 以 处 理 一 个 使 用 移 位 器 
的 参数 。 








如 果 数 据 处 理 指令 使 用 S 后 缀 ， 那 么 该 指令 就 会 更 新 cpsr 中 的 标志 位 。 移 动 和 逻辑 操作 会 更 新 C、N 和 Z。 当 移 位 器 最 后 一 位 移出 ，C 位 置 位 。N 位 设 为 结果 的 
bit[31]。 如 果 结 果 为 0， 设 置 Z 位 。 


1. 移 动 指令 
移动 指令 是 最 简单 的 ARM 指 令 ， 它 复制 N 到 目的 寄存 器 Rd 中 ， 其 中 N 可 以 是 个 寄存 器 或 者 立即 数值 。 该 指令 用 于 设置 初始 值 和 在 各 寄存 器 之 间 传输 数据 。 
语法 格式 : 


<instruction>{<cond>}{S} Rd, N 


MOV 将 32 位 的 值 移 到 一 个 寄存 器 中 Rd=N 


MVN 将 32 位 的 值 取 反 后 移 到 一 个 寄存 器 中 Rd=~N 


举例 : 
在 arch/arm/lib/crt0.S 中 有 


mov r9,sp 
mov r0,#0 


第 一 行 的 含义 为 将 sp 寄存 器 中 的 值 复制 到 r9 中 ， 第 二 行 的 含义 为 将 寄存 器 r0 的 值 设 为 0。 


f£arch/arm/cpu/armv7/nonsec virt.S 中 有 


mvn rl, #0 @ all bits to 1 


该 行将 寄存 器 r1 的 值 设 为 Oxffffffff， 也 如 注释 所 述 。 


2. 移 位 器 


N 不 仅仅 是 上 面 介绍 的 MOV 指 令 中 代表 的 寄存 器 或 者 立即 数 ， 它 还 可 以 是 寄存 器 Rm 经 过 移 位 器 预 处 理 后 的 值 。 





数据 处 理 指 令 由 算术 逻辑 单元 处 理 。ARM 处 理 器 的 一 个 独 有 且 强 大 的 特性 是 在 数据 进入 ALU 处 理 之 前 可 以 将 一 个 源 寄 存 器 中 的 32 位 二 进 制 数 向 左 或 向 右 移动 一 
个 特定 的 位 置 。 这 个 移 位 器 极 大 地 增加 了 许多 数据 处 理 指令 的 功能 和 灵活 性 。 





也 有 一 些 数据 处 理 指令 不 适用 移 位 器 ， 比 如 MUL、CLZ 和 QADD 指 令 。 


预 处 理 操作 在 指令 周期 内 进行 。 这 个 在 将 数据 乘除 2 的 指数 方 后 再 存 入 寄存 器 中 特别 高 效 。 





共有 5 种 移 位 操作 : 逻辑 左 移 LSL、 逻 辑 右 移 LSR、 算 术 右 移 ASR、 循 环 右 移 ROR 和 扩展 的 循环 右 移 RRX。 


举例 : 


f£arch/arm/cpu/arm926ejs/orionSx/lowlevel_init. SHA 


mov rl, rl, LSL #9 


该 行 表示 r1= (r1<<9) 。 


3. 算 术 指 令 





算数 指令 执行 32 位 有 符号 数 和 无 符号 数 的 加 减法 。 
语法 格式 : 
<instruction>{<cond>}{S} Rd, Rn, N 
常用 算术 指令 : 
ADC 带 进 位 的 加 法 Rd=Rn+N+carry 
ADD 加 法 Rd=Rn+N 
RSB 反 向 减法 Rd=N-Rn 
RSC ” 带 借 位 的 反 向 减法 Rd=N-Rn-! (carry flag) 
SBC ” 带 借 位 的 减法 Rd=Rn-N-! (carry flag) 
SUB 减法 Rd=Rn-N 
举例 : 
在 arch/arm/cpu/armv7/start.S 中 有 


sub sp, sp, #S FRAME SIZE @ carve out a frame on current 
add r0, sp, #S FRAME SIZE @ grab pointer to old stack 


其 中 S FRAME _SIIE 值 由 宏 #define S FRAME _SIZE72 定 义 ， 所 以 ， 第 一 行 指令 的 结果 是 sp=sp-72; 第 二 行 指 令 的 结果 是 r0=sp+72。 


4. 使 用 移 位 器 的 算术 指令 





在 算术 指令 中 使 用 移 位 器 可 产生 非常 灵活 而 且 强 大 的 功能 。 


因为 笔者 在 U-Boot 的 源码 中 并 没有 搜索 到 add 和 LSL 配 合 使 用 的 例子 (使 用 grep"add*LSL"--include="*.S"-R 的 结果 是 空 的 ) ， 所 以 自己 写 了 个 例子 以 做 简要 说 
明 : 


ADD r0, rl, rl, LSL #2 
该 行 指令 的 结果 是 r0=r1+ (r1<<2) ， 也 就 是 r0=r1*5。 


Seis SiS 





逻辑 运算 指令 执行 两 个 源 寄存 器 的 逻辑 位 运算 。 
语法 格式 : 
<instruction>{<cond>}{S} Rd, Rn, N 
常用 逻辑 运算 指令 如 下 : 
AND ”两 个 32 位 数值 的 逻辑 与 操作 Rd=Rn&N 
ORR ”两 个 32 位 数值 的 逻辑 或 操作 Rd=Rn|IN 
EOR ”两 个 32 位 数值 的 逻辑 异 或 操作 Rd=Rn^N 
BIC ”逻辑 清 位 操作 Rd=Rn&~N 
举例 : 
fearch/arm/cpu/armv7/start. SPB 


and rl, £0, #0x1f @ mask mode bits 
orr rO, r0, #0xcO @ disable FIQ and IRQ 


第 一 行 指令 的 结果 是 r1=r0&0x1f; 第 二 行 指令 的 结果 是 r0=r0|0xc0。 
6. 比 较 指 令 


比较 指令 用 于 将 寄存 器 和 一 个 32 位 数 作 比较 或 者 测试 。 指 令 根据 结果 更 新 cpsr 的 标志 位 ， 但 不 影响 其 他 的 寄存 器 。 当 设 定 标志 位 后 ， 可 以 使 用 条 件 执行 来 改变 程 
序 的 执行 流程 ， 无 需 在 比较 指令 中 使 用 S 后 缀 就 可 以 更 新 标志 位 。 


语法 格式 : 

<instruction>{<cond>} Rn, N 

常见 比较 指令 如 下 : 

CMN 否定 比较 ”依照 Rn+N 的 结果 来 设 定 标志 位 

CMP 比较 ”依照 Rn-N 的 结果 来 设 定 标志 位 

TEQ ”测试 两 个 32 位 数 是 否 相等 ”依照 Rn^N 的 结果 来 设 定 标志 位 

TST ”测试 一 个 32 位 数 的 位 ”依照 Rh&N 的 结果 来 设 定 标 志 位 
举例 : 


在 arch/arm/cpu/armv7/start.S 中 有 : 


teq rl, #0xla @ test for HYP mode 
该 行 的 含义 为 比较 是否 等 于 0x1a， 并 设 定 标志 位 ， 这 样 后 面 的 指令 可 以 根据 标志 位 来 条 件 执行 。 
7. 乘 法 指令 


乘法 指令 将 一 对 寄存 器 的 值 相 乘 ， 然 后 根据 指令 将 结果 累加 后 存 入 另外 一 个 寄存 器 中 。 长 乘法 累加 指令 将 一 对 寄存 器 组 成 一 个 64 位 的 值 。 最 后 的 结果 放 在 一 对 寄 
存 器 中 。 


语法 格式 : 


MLA{<cond>}{S} Rd, Rm, Rs, Rn 
MUL{<cond>}{S} Rd, Rm, Rs 


常见 乘法 指令 如 下 : 
MLA 乘法 和 累加 Rd= (Rm*Rs) +Rn 
MUL 乘法 Rd=Rm*Rs 
语法 格式 : 
<instruction>{<cond>}{S} RdLo, RdHi, Rm, Rs 
常见 乘法 指令 如 下 : 
SMLAL 有 符号 的 长 乘法 累加 [RdHi,RdLo]=[RdHi,RdLo]+ (Rm*Rs) 
SMULL 有 符号 的 长 乘法 [RdHi,RdLo]=Rm*Rs 
UMLAL 无 符号 的 长 乘法 累加 [RdHi,RdLo]=[RdHi,RdLo]+ (Rm*Rs) 
UMULL 无 符号 的 长 乘法 [RdHi,RdLo]=Rm*Rs 
举例 : 
在 board/mpl/vcma9/lowlevel_init.s 中 有 : 


mla r3,r4,r1,r3 


该 行 的 执行 结果 是 r3= (r4*r1) +13, 


42 分 支 指令 





分 支 指令 改变 程序 执行 流程 或 者 用 于 调用 子 程序 。 该 类 指令 可 以 使 得 程序 有 子 程序 、if-then-else 结 构 和 循环 。 
执行 流程 的 改变 强制 程序 计数 器 PC 指向 一 个 新 地 址 。ARMv5E 指 令 集 包含 四 种 不 同 的 分 支 指令 。 


语法 格式 : 


B{<cond>} label 
BL{<cond>} label 
BX{<cond>} Rm 
BLX{<cond>} label | Rm 


常用 的 分 支 指令 如 下 : 
B Bk PC=label 
BL ” 带 返 回 的 跳 转 PC=labellr= 执 行 BL 后 下 一 条 指令 的 地 址 


BX 跳 转 并 切换 状态 PC=Rm&Oxfffffffe, T=Rm&1 


BLX” 带 返回 的 分 支 并 切换 状态 PC=label, T=1 

PC=Rm&Oxfffffffe, T=Rm&1, 

Ir 为 执行 BLX 后 下 一 条 指令 的 地 址 

地 址 label 以 一 个 有 符号 的 相对 于 PC 的 偏 移 量 保存 在 指令 中 ， 必 须 被 限制 在 分 支 指令 的 约 32M 范 围 内。 
举例 : 


跳 转 指令 在 程序 中 使 用 得 最 多 ， 函 数 的 调用 应 该 都 是 用 跳 转 指令 实现 的 。 在 arch/arm/cpu/armv7/start.S 中 在 最 初 的 reset 异 常 处 理 函 数 有 下 面 两 个 函数 的 跳 
转 : 


bl cpu_init_cp15 
bl cpu_init_crit 


4.3 软 中 断 指令 


软 中 断 指令 会 引起 软件 中 断 异 常 ， 这 为 操作 系统 中 应 用 程序 调用 系统 历程 提供 了 一 种 机 制 。 
语法 格式 : 

SWI{<cond>} SWI number 

常用 的 软 中 断 指令 如 下 : 

SWI 软 中 断 Ir_svc=SWI 指 令 之 后 下 一 条 指令 的 地 址 

Spsr_svc=cpsr 

Pc=vectors+0x8 

Cpsr mode=SVC 


Cpsr 1=1 (屏蔽 IRQ 中 断 ) 





当 处 理 器 执行 一 条 SWI 指 令 ， 设 置 程序 计数 器 PC 为 向 量 表 中 偏 移 量 为 0x8 的 位 置 。 该 条 指令 强制 将 处 理 器 模式 改 为 SVC， 这 样 就 允许 在 特权 模式 下 操作 系统 例 程 
可 以 被 调用 。 


每 一 条 SWI 指 令 有 一 个 相关 的 SWI 数 ， 用 于 代表 一 个 特别 的 函数 调用 或 者 属性 。 





SWI 指 令 最 常见 的 应 用 就 是 操作 系统 的 系统 调用 的 实现 。 





举例 : 


在 Linux 下 用 汇编 写 一 个 经 典 程序 “hello world” : 


.data 
msg: .asciz "hello, world\n" 
“text 
.align 2 
global start 
_start: 
ldr rl, =msg @ address 
mov r0, #1 @ stdout 
mov r2, #13 @ length 
swi #0x900004 @ sys write 
mov ro, #0 g 
swi #0x900001 @ sys exit 
.align 2 E 


使 用 交叉 编译 器 编译 后 放 在 运行 在 ARM 平 台 下 的 Linux 系 统 中 运行 ， 就 可 以 在 终端 中 看 到 “hello world” 的 输出 。 这 里 0x900004 是 system write 的 SWI 数 ; 
0x900001 是 system exit 的 SWI 数 。 


4A 程序 状态 寄存 器 指令 





ARM 指 令 集 提供 两 条 指令 来 直接 控制 程序 状态 寄存 器 (psr) 。MRS 指 令 将 cpsr 或 spsr 的 内 容 传 到 寄存 器 中 ; 相反 的 ，MSR 指 令 将 寄存 器 的 内 容 传 到 cpsr 或 spsr 
中 。 综 合 起 来 ， 这 些 指 令 用 于 读 写 cpsr 和 spsr。 


语法 格式 : 





MRS{<cond>} Rd,<cpsr|spsr> 
MSR{<cond>} <cpsr|spsr>_<fields>, Rm 
MSR{<cond>} <cpsr|spsr>_<fields>, #immediate 











从 语法 格式 中 可 以 看 到 有 一 个 成 为 <fields> 的 域 ， 它 可 以 是 控制 位 c、 扩 展位 x、 状 态 位 s 和 标志 位 f 的 任意 组 合 。 PSR 域 组 成 如 图 4-1 所 示 。 


Flelds | Fields [24:31] | Fields [16:23] | eXtension [8:15] | Control [0:7] | 
Bit 31 30 29 28 





图 4-1 PSR 域 组 成 


程序 状态 寄存 器 指令 的 含义 如 下 : 
MRS ”复制 程序 状态 寄存 器 到 通用 寄存 器 中 Rd=psr 
MSR ”将 通用 寄存 器 的 值 传 到 程序 状态 寄存 器 中 psrlfield]=Rm 
MSR ”将 立即 数 的 值 传 到 程序 状态 寄存 器 中 psrlfield]= 立 即 数 
MRS 和 MSR 经 常 配合 使 用 。 

举例 : 


在 arch/arm/cpu/armv7/start.S 中 有 : 





mrs r0, cpsr 

and rl, r0, #0x1f @ mask mode bits 

teq rl, #0xla @ test for HYP mode 

bicne r0, r0, #0x1f @ clear all mode bits 
orrne r0, r0, #0x13 @ set SVC mode 

orr rO, FO; #0xc0 @ disable FIQ and IRQ 

msr cpsr, r0 





通过 mrs 指 令 和 msr 指 令 来 重新 设 定 cpsr 的 值 。 


4.5 ” 协 处 理 器 指令 


协 处 理 器 是 指令 集 的 扩展 。 协 处 理 器 既 可 以 提供 额外 的 计算 能 力 ， 也 用 于 控制 包括 Cache 和 存储 管理 在 内 的 存储 系统 。 协 处 理 器 指令 包括 数据 处 理 、 寄 存 器 传输 
和 内 存 传输 指令 。 这 里 只 对 协 处 理 器 做 简要 说 明 ， 因 为 这 些 指 令 与 具体 的 协 处 理 器 相关 。 注 意 协 处 理 器 指令 只 用 于 带 有 协 处 理 器 的 ARM 核 。 


语法 格式 : 





CDP{<cond>} cp, opcodel, Cd, Cn {, opcode2} 
<MRC|MCR>{<cond>} cp, opcodel, Rd, Cn, Cm {, opcode2} 
<LDC|STC>{<cond>} cp, Cd, addressing 


协 处 理 器 指令 的 含义 如 下 : 


CDP 协 处 理 器 数据 处 理 一 一 在 协 处 理 器 中 执行 一 个 操作 


MRC|MCR 协 处 理 器 寄存 器 传输 一 一 从 协 处 理 器 中 移出 数据 或 者 移入 数据 
LDC STC 协 处 理 器 内 存 传输 一 一 从 协 处 理 器 中 load/store 内 存 


在 协 处 理 器 指令 语法 中 ，cp 域 代表 协 处 理 器 的 编号 p0 一 p15，opcode 域 表示 要 在 协 处 理 器 中 进行 的 操作 。Cn、Cm 和 Cd 域 描述 在 协 处 理 器 中 的 寄存 器 。 协 处 理 
器 的 操作 和 寄存 器 依赖 于 集体 使 用 的 协 处 理 器 。 协 处 理 器 15 (CP15) 是 为 系统 控制 预 留 的 ， 比 如 内 存 管理 、 写 缓冲 控制 、Cache 控 制 和 寄存 器 识别 等 。 





协 处 理 器 15 的 语法 格式 











CP15 配 置 处 理 器 核 ， 并 有 一 组 专用 的 寄存 器 用 于 存储 配置 信息 。 通 过 写 一 个 值 到 一 个 寄存 器 中 来 配置 一 项 属性 ， 比 如 打开 Cache。 


CP15 称 为 系统 控制 协 处 理 器 。MRC 和 和 MCR 指令 用 于 读 写 CP15， 其 中 寄存 器 Rd 是 内 核 目标 寄存 器 ，Cn 是 主 寄存 器 ，Cm 是 次 寄存 器 ，opcode2 是 次 寄存 器 修饰 
符 。 次 寄存 器 也 可 以 称 为 扩展 寄存 器 。 








举 个 例子 ,下 面 一 条 指令 是 将 CP15 中 控制 寄存 器 c1 的 内 容 复制 到 处 理 器 核心 中 的 寄存 器 r1 中 : 
MRC p15, 0, rl, cl, cO, R 
为 了 便于 对 CP15 的 配置 寄存 器 进行 说 明 ， 使 用 下 面 的 缩写 格式 : 


CP15:cX:cY:Z 


第 一 部 分 CP15 定 义 它 是 协 处 理 器 15; 冒号 后 的 第 二 部 分 是 主 寄存 器 ，X 的 值 的 范围 是 0~15; 第 三 部 分 是 次 寄存 器 (或 者 称 其 为 扩展 寄存 器 ) ，Y 的 值 的 范围 是 


0~15; 最 后 一 部 分 opcode2 是 指令 修饰 符 ， 值 为 0~ 7。 


有 些 操作 可 能 用 到 一 个 非 零 值 (w) 的 opcode1， 这 种 格式 表示 为 


CP15:wicX:cY:Z 


举例 : 
协 处 理 器 指令 用 于 配置 缓存 、MMU 等 核心 单元 。 在 arch/arm/cpu/armv7/start.S 中 有 : 


/* 
* Invalidate L1 I/D 
g4 


set up for MCR 
invalidate TLBs 
invalidate icache 
invalidate BP array 
DSB 

ISB 


mov r0, #0 

mer pla; 0; 20, 68, <7, 0 

mcr pl5, 0, r0, c7, c5, 0 

mcr pl5, 0, FOr c7, cd, 6 

mcr pl5, 0, rO; c7, cl0, 4 
mcr pls, Os 10, tlr Chy 4 


QBQ@2AA@® 


如 上 几 行 代码 使 用 协 处 理 器 指令 控制 协 处 理 器 p15 来 达到 使 指令 和 代码 的 L1 级 Cache 失 效 的 目的 。 


46 ”加 载 常量 的 伪 指 令 


前 面 介绍 了 那么 多 指令 ， 但 仍 没有 一 条 ARM 可 以 把 一 个 32 位 的 常量 装 入 寄存 器 中 。 因 为 ARM 指 令 本 身 就 是 32 位 长 度 ， 所 以 很 显然 指令 中 不 可 能 再 定义 一 个 32 位 


Hi 


的 常 





为 了 方便 编程 ， 有 两 条 伪 指 令 可 以 将 32 位 值 装 入 寄存 器 中 。 
语法 格式 : 


LDR Rd, =constant 
ADR Rd, label 


加 载 常量 的 伪 指 令 的 含义 如 下 : 
LDR ”加 载 常量 的 伪 指 令 Rd=32 位 的 常量 


ADR ”加 载 地 址 的 伪 指 令 ”Rd=32 位 的 相对 地 址 











第 一 条 伪 指 令 用 于 把 一 个 32 位 常量 送 入 寄存 器 ， 它 的 具体 执行 可 以 是 任何 可 实现 该 功能 的 指令 。 如 果 常 数 无 法 用 其 他 的 指令 编码 ， 该 指令 就 读 取 内 部 人 存储。 第 二 
条 伪 指 令 向 寄存 器 中 写 入 一 个 相对 地 址 ， 它 会 使 用 一 个 PC 相对 地 址 的 表达 式 进行 编码 。 


举例 : 


在 arch/arm/lib/crt0.S 有 





adr lr, here 


其 中 ，here 是 一 个 标号 ， 本 身 就 是 32 位 长 度 ， 该 条 伪 指 令 实际 是 用 add Ir pc#12 来 实现 的 。 


47 本章 小 结 


本 章 列 出 了 ARM 指 令 集 中 6 大 类 指令 的 使 用 方法 ， 请 读者 熟 读 所 有 的 指令 并 在 实践 中 熟练 运用 大 部 分 常用 的 指令 。ARM 指 令 集 与 下 章 讲述 的 寻 址 模式 相 结 合 会 产 
生 许 多 复杂 的 应 用 ， 请 读者 先 打 好 ARM 指 令 集 的 基础 。 


第 5 章 ARM 寻 址 模式 


本 章 导读 
ARM 寻 址 模式 是 ARM 处 理 器 设计 的 一 大 特色 ， 也 是 决定 ARM 处 理 器 优异 性 能 的 其 中 一 个 因素 。 
这 一 章 描述 ARM 指 令 集 中 使 用 的 5 种 寻 址 模式 : 
5.1 节 介绍 寻 址 模式 1 一 一 数据 处 理 指令 的 操作 数 的 寻 址 模式 
5.2 节 介绍 寻 址 模式 2 一 一 字 和 无 符号 字 节 的 load/store 指 令 的 寻 址 方式 
5.3 节 介绍 寻 址 模式 3 一 一 杂 类 load/store 指 令 的 寻 址 方式 


5.4 节 介绍 寻 址 模式 4 一 一 批量 load/store 指 令 的 寻 址 方式 





5.5 节 介绍 寻 址 模式 5 一 一 协 处 理 器 load/store 指 令 的 寻 址 方式 


51 寻 址 模式 1 一 一 数据 处 理 指令 的 寻 址 模式 


通用 的 指令 格式 如 下 ， 在 ARM 数 据 处 理 指令 中 共有 11 种 方式 用 于 计算 <shifer_ operand> 。 其 指令 语法 格式 如 下 : 


<opcode>{<cond>}{S} <Rd>, <Rn>, <shifter operand> 





其 中 <shifter operand> 是 下 列 之 一 : 





#<immediate> 

<Rm> 

<Rm>, LSL #<shift imm> 
<Rm>, LSL <Rs> | 
<Rm>, LSR #<shift imm> 
<Rm>, LSR <Rs> 
<Rm>, ASR #<shift imm> 
<Rm>, ASR <Rs> 
<Rm>, ROR #<shift imm> 
<Rm>, ROR <Rs> ` 
<Rm>, RRX 





5.2“ 寻 址 模式 2 一 字 或 无 符号 字 节 的 load/store 指 令 


对 于 字 或 无 符号 字 节 的 load/store 指 令 有 9 种 方式 计算 地 址 。 


基本 的 指令 语法 是 : 





LDR|STR{<cond>}{B}{T} <Rd>, <addressing_mode> 





其 中 <addressing mode> 是 下 列 之 一 : 





[<Rn>, #+/-<offset_12>] 

[<Rn>, +/-<Rm>] 

[<Rn>, +/-<Rm>, <shift> #<shift imm>] 
[<Rn>, #+/-<offset_12>]! 加 
[<Rn>, +/-<Rm>]! 

[<Rn>, +/-<Rm>, <shift> #<shift imm>]! 
[<Rn>], #+/-<offset 12> a 
[<Rn>], +/-<Rm> a 

[<Rn>], +/-<Rm>, <shift> #<shift_imm> 





所 有 的 9 种 都 适用 于 LDR、LDRB、STR 和 STRB。 而 对 于 LDRBT、LDRT、STRBT 和 STRT， 只 有 最 后 3 种 适用 。 对 于 PLD 指令 ， 只 有 前 3 种 适用 。 


5.3” 寻 址 模式 3 一 一 杂 类 |oad/store 指 令 的 寻 址 方式 


共有 6 种 格式 用 于 计算 地 址 : load/store 有 符号 或 无 符号 的 半 字 ，load 有 符号 字 节 或 load/store 双 字 指 令 。 这 类 指令 的 语法 格式 是 : 





LDR|STR{<cond>}H|SH|SB|D <Rd>, <addressing mode> 





其 中 <addressing_ mode> 是 下 列 6 种 方式 之 一 : 





[<Rn>, #+/-<offset_8>] 
[<Rn>, +/-<Rm>] 

[<Rn>, #+/-<offset_8>]! 
[<Rn>, +/-<Rm>]! 
[<Rn>], #+/-<offset_8> 
[<Rn>], +/-<Rm> 加 





5.4 ” 寻 址 模式 4 一 一 批量 load/store 


批量 load 指 令 的 作用 为 从 内 存 中 加 载 值 到 多 个 通用 寄存 器 。 批 量 store 指 令 的 作用 为 存 取 多 个 通用 寄存 器 的 值 到 内 存 中 。 


批量 load/store 寻 址 模式 可 产生 一 串 地 址 范围 。 编 号 低 的 寄存 器 对 应 于 内 存 中 低地 址 单元 ， 编 号 高 的 寄存 器 对 应 于 内 存 中 高 地 址 单元 。 


语法 格式 : 





LDM|STM{<cond>}<addressing mode><Rn>{!}, <registers>{*} 





其 中 <addressing mode> 是 下 列 四 种 寻 址 模式 中 的 一 种 : 
IA (执行 后 增加 ) 
IB (执行 前 增加 ) 
DA (执行 后 减少 ) 


DB (执行 前 减少 ) 


5.5” 寻 址 模式 5 一 一 协 处 理 器 的 load/store 


共有 四 种 寻 址 模式 用 于 计算 协 处 理 器 的 load/store 指 令 的 地 址 。 指 令 的 语法 是 : 





<opcode>{<cond>} {L} <coproc>,<CRd>,<addressing_mode> 


其 中 <addressing_mode> 是 下 列 之 一 : 


[<Rn>, #+/-<offset 8>*4] 

[<Rn>, #+/-<offset_8>*4]! 
[<Rn>], #+/-<offset_8>*4 

[<Rn>],<option> ` 


5.6 ”本章 小 结 





本 章 详细 的 描述 了 ARM 的 5 种 寻 址 模式 ， 每 一 种 寻 址 模式 都 非常 复杂 并 且 容 易 混淆 ， 希 望 读 者 慢 慢 掌握 它们 的 规律 ， 理 解 ARM 的 指令 集 以 及 寻 址 模式 。 





第 6 章 ”编译 和 链接 


本 章 导读 

本 章 介绍 最 容易 忽略 的 知识 背景 : 编译 和 和 链接。 通常 在 应 用 层 的 开发 中 ， 我 们 并 不 需要 关注 编译 和 链接 的 细节 ， 但 是 对 于 BootLoader 这 种 特殊 的 程序 代码 ， 必 须 
深入 理解 编译 和 链接 的 细节 ， 才 能 够 完全 掌控 BootLoadet 的 构成 。 

6.1 节 描述 ELF 文 件 结构 。 

6.2 节 描述 ELF 中 重要 的 段 表 结 构 。 

6.3 节 介绍 ELF 中 符号 表 的 结构 。 

6.4 节 介绍 存储 空间 的 分 配 。 

6.5 节 介绍 重 定位 。 

6.6 节 介绍 静态 链接 和 重 定位 。 

编译 器 和 汇编 器 从 源 文件 中 创建 包含 二 进 制 代码 和 数据 的 对 象 文件 。 


在 介绍 分 析 ELF 格 式 以 及 编译 链接 之 前 ,我们 先 介绍 一 下 UNIX/Linux 系 统 下 可 以 帮助 我 们 理解 和 处 理 目标 文件 的 工具 。 其 中 GNU binutils 包 最 有 帮助 ， 并 且 它 可 
以 运行 在 每 个 UNIX 平 台 上 。 


GNU binutils 包 中 有 以 下 一 系列 工具 。 
AR: 可 以 对 静态 库 做 创建 、 修 改 和 取出 的 操作 。 


STRINGS: 列 出 任何 二 进 制 文件 内 的 可 显示 的 字符 串 。 

















STRIP: 从 目标 文件 中 删除 符号 表 信 息 。 
NM: 列 出 目标 文件 中 的 符号 表 中 定义 的 所 有 符号 。 


SIZE: 列 出 目标 文件 中 节 的 名 字 和 大 小 。 














READELF: 显示 一 个 目标 文件 的 完整 结构 ， 包 括 ELF 头 中 编码 的 所 有 信息 。 包 含 SIZE 和 NM 的 功能 。 





OBJDUMP: 非常 强大 的 二 进 制 工 具 。 能 够 显示 一 个 目标 文件 中 的 所 有 信息 。 它 最 大 的 作用 是 反 汇编 .text 节 中 的 二 进 制 指令 。 


在 UNIX/Linux 中 ， 编 译 的 输出 文件 名 默认 是 a.out。 最 初 UNIX 使 用 a.out 格 式 ， 传 统 的 a.out 格 式 已 经 被 UNIX 社 区 使 用 了 十 多 年 ， 但 是 在 推出 Unix System V 
后 ，AT&T 认 为 它 需 要 更 好 地 支持 交叉 编译 、 动 态 链接 和 其 他 的 系统 属性 ， 而 早期 设计 的 a.out 格 式 无 法 支持 这 些 属性 。Unix System V 的 早期 版 本 使 用 COFF (通用 
对 象 文 件 格式 ) ， 它 最 初 是 为 交叉 编译 的 嵌入 式 系统 设计 的 。 因 为 它 无 扩展 版 本 支持 C+ + 和 动态 链接 ， 所 以 并 不 能 在 所 有 的 分 时 系统 上 很 好 地 工作 。 在 UNIX 

















System V 的 后 期 版 本 中 ，COFF 就 被 ELF (可 执行 和 可 链接 格式 ) 取代 了 。ELF 也 被 流行 的 开源 Linux 和 UNIX 变 种 BSD 软 件 所 采用 。 在 这 里 我 们 只 讨论 32 位 的 ELF。 


ELF 文 件 有 三 种 略 有 不 同 的 类 型 : 可 重 定位 文件 、 可 执行 文件 和 共享 目标 文件 。 可 重 定位 的 文件 由 编译 器 和 汇编 器 创建 ， 但 是 在 运行 之 前 需要 被 链接 器 处 理 。 可 
执行 文件 已 经 完成 了 所 有 的 重 定位 工作 和 符号 解析 (除了 在 运行 时 需要 解析 的 共享 库 符 号 ) 。 共 享 目标 文件 就 是 共享 库 ， 包 含 链接 器 需要 的 符号 信息 ， 也 包含 运行 时 
可 直接 运行 的 代码 。 各 ELF 文 件 类 型 的 说 明 如 表 6-1 所 示 。 


表 6-1 ELF 文 件 类 型 说 明 


ELF 文件 类 型 实例 


该 类 文件 包含 代码 和 数据 ， 用 于 链接 成 可 执行 文件 或 共享 目标 linux F .o 文 件 和 a 
可 重 定 位 文件 文件 后 使 用 ， 静 态 链接 库 也 可 以 归结 为 该 类 ; 静态 库 文件 实际 上 m je pe | | 
是 将 很 多 目标 文件 捆绑 在 一 起 形成 一 个 文件 包 ， 再 加 上 一 些 索 引 | 


a = : EES p 比如 bin /usr/bin H 
A Ae 人 - yit Ae > 看 也 Fy 1 vy = 六 全 ifi Zx 年 储 器 并 
可 执行 文件 包含 二 进 制 代码 和 数据 ， 可 以 直接 复制 到 存储 右 并 执行 录 下 的 文件 
一 种 特殊 类 型 的 可 重 定位 目标 文件 ， 可 以 在 加 载 或 者 运行 时 被 
动态 地 加 载 到 存储 器 并 链接 


共享 目标 文件 linux 下 的 .so 文件 





在 Linux 下 可 以 使 用 file 命 令 来 查看 相应 的 文件 格式 ， 上 述 几 种 文件 在 file 命 令 下 显示 相应 的 类 型 。 


可 重 定位 文件 : 





bash-4.2# file Socket.o 
Socket.o: ELF 32-bit LSB relocatable, ARM, version 1 (SYSV), not stripped 





可 执行 文件 : 





bash-4.2# file busybox 
busybox: ELF 32-bit LSB executable, ARM, version 1 (SYSV), dynamically linked (uses shared libs), stripped 





共享 目标 文件 ; 





bash-4.2# file libQtGui.so.4.8.2 
libQtGui.so.4.8.2: ELF 32-bit LSB shared object, ARM, version 1 (SYSV), dynamically linked, stripped 





6.1 ELF 文 件 结构 描述 


ELF 目 标 文件 格式 的 最 前 部 是 ELF 文 件 头 ， 它 描述 了 整个 文件 的 基本 属性 ， 比 如 ELF 文 件 类 型 、 版 本 、 目 标 机 器 类 型 以 及 程序 入 口 地 址 等 。 紧 接着 就 是 ELF 文 件 的 
各 个 段 。 其 中 ELF 文 件 中 与 段 有 关 的 重要 结构 就 是 段 表 (Section Header Table) ， 该 表 描 述 了 ELF 文 件 包 含 的 所 有 段 的 信息 ， 比 如 每 个 段 的 段 名 、 段 的 长 度 、 在 文 
件 中 的 偏 移 、 读 写 权 限 以 及 段 的 其 他 属性 。 接 着 将 详细 分 析 ELF 文 件 头 、 段 表 等 ELF 的 关键 结构 。 








我 们 可 以 使 用 arm-fsl-linux-gnueabi-readelf 命 令 来 详细 查看 ELF 文 件 。 
首先 给 出 simpleelf.c 的 源码 : 


代码 清单 6-1: simpleelf.c 的 代码 





int printf( const char *format, http://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15768/OEBPS/Text/...)7 
int g var = 45; 加 

int g var2; 

void func( int i ) 


printf ("sd\n", i); 
int main (void) 


static int s var = 48; 

static int s var2; 

inta=2; — 

int b; 

func( s var + s var2 + a+b); 
return a; 





查看 上 述 文件 编译 后 的 对 象 文件 ， 执 行 readelf 操 作 : 





bash-4.2# arm-fsl-linux-gnueabi-readelf simpleelf.o -h 


ELF Header: 


Magic: 7£ 45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00 


Class: 

Data: 

Version: 

OS/ABI: 

ABI Version: 

Type: 

Machine: 
Version: 

Entry point address: 

Start of program headers: 

Start of section headers: 
Flags: 

Size of this header: 

Size of program headers: 
Number of program headers: 
Size of section headers: 
Number of section headers: 


ELF32 

2's complement, little endian 
1 (current) 

UNIX - System V 

0 


REL (Relocatable file) 
ARM 


0x1 
0x0 
0 (bytes into file) 
376 (bytes into file) 
0x5000000, Version5 EABI 
52 (bytes) 
0 (bytes) 


Section header string table index: 9 





从 如 上 代码 可 以 看 出 ，ELF header 定 义 了 幻 数 、 机 器 字 节 长 度 、 数 据 存储 方式 、 版 本 、 系 统 和 ABI 版 本 、ELF 文 件 类 型 、 目 标 硬件 平台 、 硬 件 平台 版 本 、 入 口 点 


地 址 、 程 序 头 入 口 和 长 度 、 段 头 入 口 、ELF 头 的 长 度 、 程 序 头 的 数目 、 段 头 的 长 度 、 段 头 的 数目 、 段 头 字符 串 表 的 索引 。 


ELF 文 件 头 结构 和 相关 常数 定义 在 elf.h 中 ， 因 为 我 们 这 里 使 用 的 是 交叉 编译 器 ， 所 以 该 文件 位 于 交叉 编译 器 安装 的 目录 下 ， 在 笔者 的 机 器 上 是 下 面 的 路 径 : 





/usr/local/fsl/arm-fsl-linux-gnueabi/arm-fsl-linux-gnueabi/include 





因为 ELF 文 件 在 各 种 平台 下 都 通用 ， 前 面 也 提 到 了 ELF 文 件 有 32 位 版 本 和 64 位 版 本 。 在 elf.h 文 件 中 就 对 应 着 这 两 种 版 本 的 两 个 结构 体 定 义 Ef32_Ehdr 和 
EIf64_Ehdr。32 位 版 本 和 64 位 版 本 的 ELF 文 件 的 文件 头 内 容 相同 ， 只 是 有 些 成 员 的 大 小 不 一 样 。 为 了 对 每 个 成 员 的 大 小 做 出 明确 的 规定 以 便于 在 不 同 的 编译 环境 下 都 
拥有 相同 的 字段 长 度 ，elf.h 使 用 typedef 关 键 字 定义 了 一 套 自己 的 变量 ， 如 表 6-2 所 示 。 


自 定义 类 型 
Elf32_Half 
Elf64 Half 
Elf32 Word 
Elf32 Sword 
Elf64 Word 
Elf64 Sword 
Elf32_Xword 
Elf32_Sxword 
Elf64 Xword 
Elf64 Sxword 
Elf32_Addr 
Elf64 Addr 


表 6-2 数据 类 型 定义 


32 位 版 本 无 符号 长 整形 
32 位 版 本 有 符号 长 整形 


64 位 版 本 地 址 


原始 类 型 
uint16 ft 
uintl6_t 
uint32_ t 
int32 t 
uint32 t 
int32 t 
uint64 t 
int64 t 
uint64 t 
int64 t 
uint32_t 


uint64 t 





Elf32_Off 


32 (AAS i FS 


uint32_t 





Elf64_Off 


64 位 版 本 偏 移 


uint64 t 





Elf32_Section 


32 位 版 本 段 目录 


uint16 t 





Elf64 Section 


64 位 版 本 段 目录 


uint16 t 





Elf32_Versym 


32 位 版 本 版 本 符号 信息 


uint16 t 





Elf64 Versym 





64 位 版 本 版 本 符号 信息 


前 面 已 经 提 过 了 只 分 析 32 位 版 本 ， 所 以 下 面 以 32 位 版 本 的 文件 头 结构 Elf32_Ehdr 作 为 例子 来 描述 ， 定 义 如 下 : 


uint16 t 





typedef struct 
{ 


unsigned char 


Elf32 Half e type; 
Elf32 Half e machine; 
Elf32 Word e_version; 


e ident [EI_NIDENT] ; 


/* Magic number and other info */ 
/* Object file type */ 

/* Architecture */ 

/* Object file version */ 


E1f32_Addr e entry /* Entry point virtual address */ 
E1£32_Off e_phoff /* Program header table file offset */ 
E1f32_Off e_shoff /* Section header table file offset */ 
Elf32 Word e flags /* Processor-specific flags */ 
Elf32_Half e_ehsize /* ELF header size in bytes */ 
Elf32 Half e_ phentsize /* Program header table entry size */ 
Elf32 Half e_phnum /* Program header table entry count */ 
Elf32 Half e_shentsize /* Section header table entry size */ 
Elf32 Half e_shnum /* Section header table entry count */ 
Elf32 Half e shstrndx /* Section header string table index */ 
} Elf32 Ehdr; 








Eth “unsigned char e_ident[El_NIDENT]; ”中 的 EL_NIDENT 使 用 宏 定义 #define El_NIDENT(16) 说 明 。 
我 们 可 以 用 vi 查看 simpleelf.o 文 件 : 


Vi simpleelf.o 后 ， 输 入 %!xxd 可 以 查看 二 进 制 文件 的 16 进 制 格 式 ， 如 图 6-1 所 示 。 


7£45 
0100 
7801 
0c00 
0800 
04d0 
0048 
0c30 


-ELF.. 


By eae 


Mewes 

.... -H-. 
AE: bee 
Pts LAE 
有 全 上 人 二 





图 6-1 16 进 制 格式 视图 下 的 simpleelf.o 


我 们 拿 ELF 文 件 头 结构 和 前 面 readelf{ 输 出 的 ELF 文 件 头 信息 以 及 16 进 制 格式 作对 比 ， 可 以 看 到 输出 的 信息 与 ELF 文 件 头 中 的 结果 大 多 数 都 一 一 对 应 ， 如 表 6-3 所 


àl 


表 6-3 ELEF 文 件 头 结 构 和 信息 对 应 表 





成 员 readelf 输出 结果 和 含义 十 六 进 制 输出 
Magic: 7f45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00 
Class: ELF32 
7f45 4c46 


Data: 2's complement, little endian 


0101 0100 0000 0000 
0000 0000 


e ident[EI NIDENT] À 
Version: 1 (current) 


OS/ABI: UNIX - System V 
ABI Version: 0 


Type: REL (Relocatable file ) 0x0100 





e_type 























e_machine Machine: ARM 0x2800 
e version Version: 0x1 0x0100 0000 
e_shoff Start of section headers: 376 (bytes into file) 0x7801 0000 
e_flags Flags: 0x5000000, VersionS EABI 0x0000 0005 
e_phentsize Size of program headers: 0 (bytes ) 0x0000 
e phnum Number of program headers: 0 0x0000 
e_shentsize Size of section headers: 40 (bytes ) 0x2800 


e_shnum 


e_shstrndx 





Number of section headers: 12 0x0c00 
Section header string table index: 9 0x0900 


EH, e ident[El NIDENT|}@#§Magic, Class, Data, Version, OS/ABI, ABI Version, 


这 些 可 以 结合 elf.h 中 的 定义 一 起 看 。 


Eth, MagicA0x7f454c46: 

















define EI MAGO 0 /* File identification byte 0 index */ 
define ELFMAGO Ox7£ /* Magic number byte 0 */ 

define EI MAG1 1 /* File identification byte 1 index */ 
define ELFMAG1 'E! /* Magic number byte 1 */ 

define EI MAG2 2 /* File identification byte 2 index */ 
define ELFMAG2 vi /* Magic number byte 2 */ 

define EI MAG3 3 /* File identification byte 3 index */ 
define ELFMAG3 ip /* Magic number byte 3 */ 

/* Conglomeration of the identification bytes, for easy testing as a word. */ 

define ELFMAG "\177ELE" 

define SELFMAG 4 

Class 为 0x01: 

#define EI CLASS /* File class byte index */ 

#define ELFCLASSNONE /* Invalid class */ 

#define ELFCLASS32 /* 32-bit objects */ 


#define ELFCLASS64 
#define ELFCLASSNUM 





WNHOrFROB 


/* 


64-bit objects */ 





所 以 表明 是 32 位 的 目标 文件 。 


Data 为 Ox01: 





#define EI DATA 

#define ELFDATANONE 
#define ELFDATA2LSB 
#define ELFDATA2MSB 
#define ELFDATANUM 


WNPOU 


/* 
/* 
/* 
/* 


Data encoding byte index */ 
Invalid data encoding */ 

2's complement, little endian */ 
2's complement, big endian */ 





所 以 使 用 的 2's complement, little endian, 


Version 为 Ox01: 





#define EI VERSION 6 


#define EV_NONE 
#define EV_CURRENT 
#define EV_NUM 


NRO 


/* E 


ile version byte index */ 


/* Value must be EV CURRENT */ 


/* I 
/* c 


nvalid ELF version */ 
urrent version */ 





从 注释 中 看 出 ， 该 值 必须 为 EV_CURRENT。 


























OS/ABI A 0x00: 

define EI_OSABI 7 /* OS ABI identification */ 
define ELFOSABI_NONE 0 /* UNIX System V ABI */ 

define ELFOSABI SYSV 0 /* Alias. */ 

define ELFOSABI_HPUX 1 /* HP-UX */ 

define ELFOSABI_NETBSD 2 /* NetBSD. */ 

define ELFOSABI_LINUX 3 /* Linux. */ 

define ELFOSABI_ SOLARIS 6 /* Sun Solaris. */ 

define ELFOSABI_AIX 7 /* IBM AIX. */ 

define ELFOSABI_IRIX 8 /* SGI Irix. */ 

define ELFOSABI_FREEBSD 9 /* FreeBSD. */ 

define ELFOSABI_TRU64 10 /* Compaq TRU64 UNIX. */ 
define ELFOSABI MODESTO 11 /* Novell Modesto. */ 

define ELFOSABI_OPENBSD 12 /* OpenBSD. */ 

define ELFOSABI_ARM 97 /* ARM */ 

define ELFOSABI STANDALONE 255 /* Standalone (embedded) application */ 
所 以 OS/ABI 为 UNIX System V ABI, 

ABI Version 为 0x00: 

#define EI ABIVERSION 8 /* ABI version */ 

#define EI PAD 9 /* Byte index of padding bytes */ 





从 第 9 个 字 节 开始 后 面 的 几 个 字 节 都 填充 为 0%， 并 没有 定义 。 


e type 为 Type: REL (Relocatable file) 0x0100 


各 种 e_type 的 值 如 下 代码 中 定义 : 





/* Legal values for e type (object file type). 
#define ET NONE 7 
#define ET REL 
#define ET EXEC 
#define ET DYN 
#define ET CORE 
tdefine ET_NUM 
#define ET LOOS Oxfe00 
#define ET HIOS Oxfeff 


Cn 心口 


No file type */ 
Relocatable file */ 
Executable file */ 

Shared object file */ 
Core file */ 

Number of defined types */ 
OS-specific range start */ 
OS-specific range end */ 


#define ET LOPROC Oxf£00 /* Processor-specific range start */ 
#define ET HIPROC Oxffff /* Processor-specific range end */ 


因为 是 小 端 格式 ， 所 以 其 值 为 1， 也 就 是 可 重 定位 文件 。 
e machineMachine: ARM 0x2800 


各 种 e machine 的 值 如 下 代码 中 定义 : 


/* Legal values for e machine (architecture). */ 
#define EM ARM 40 /* ARM */ 


同样 在 小 端 格 式 下 ，40 就 是 0x2800。 
e version Version: 0x1 0x0100 0000 


各 种 e_version 的 值 如 下 代码 中 定义 : 


/* Legal values for e version (version). */ 

#define EV_ NONE 0 /* Invalid ELF version */ 
#define EV CURRENT 1 /* Current version */ 
#define EV_NUM 2 

0x1 表 明 是 当前 的 版 本 。 


e entry Entry point address: 0x0 


入 口 地 址 ， 规 定 ELF 程 序 的 入 口 虚拟 地 址 ,操作 系统 在 加 载 完 该 程序 后 从 这 个 地 址 开始 执行 进程 的 指令 。 可 重 定位 文件 一 般 没 有 入 口 地 址 ， 这 个 值 为 0。 
e phoff Start of program headers: 0 (bytes into file) 

其 含义 暂时 不 用 关心 

e shoff Start of section headers: 376 (bytes into file) 

段 表 在 文件 中 的 偏 黎 ， 段 表 从 文件 的 第 377 个 字 节 开始 。 

e flags Flags: 0x5000000, Version5 EABI 

e ehsize Size of this header: 52 (bytes) 

ELF 文 件 头 本 身 的 大 小 ， 也 就 是 sizeof (Elf32_Ehdr) 的 值 ， 为 52 个 字 节 。 
e_phentsize Size of program headers: 0 (bytes) 

e phnum Number of program headers: 0 

e shentsize Size of section headers: 40 (bytes) 

段 表 描述 符 的 大 小 ， 一 般 等 于 sizeof (Elf32_Shdr) 

e shnum Number of section headers: 12 

段 表 描 述 符 数量 。 这 个 值 等 于 ELF 文 件 中 拥有 的 段 的 数量 。 

e_shstrndx Section header string table index: 9 


字符 串 表 所 在 的 段 的 索引 值 。 


6.2 RE 


我 们 知道 ELF 文 件 中 有 很 多 各 种 各 样 的 段 ， 段 表 (Section Header Table) 就 是 保存 段 的 基本 属性 的 结构 。 段 表 是 ELF 文 件 中 除了 ELF 文 件 头 以 外 最 重要 的 结构 ， 
它 同样 在 elf.h 文 件 中 定义 ， 代 码 如 下 。 


/* Section header. */ 
typedefstruct 


Elf32 Word sh name; /* Section name (string tbl index) */ 
Elf32 Word sh type; /* Section type */ 


Elf32 Word sh flags; /* Section flags */ 

Elf32 Addr sh addr; /* Section virtual addr at execution */ 
Elf32 Off sh offset; /* Section file offset */ 

Elf32 Word sh size; /* Section size in bytes */ 

Elf32 Word sh link; /* Link to another section */ 

Elf32 Word sh info; /* Additional section information */ 
Elf32 Word sh addralign; /* Section alignment */ 

Elf32 Word sh entsize; /* Entry size if section holds table */ 


} E1£32_Shdr; 


从 结构 体 定义 可 以 看 出 ， 它 描述 了 每 个 段 的 段 名 、 段 的 类 型 、 段 的 长 度 、 在 文件 中 的 偏 移 、 读 写 权限 以 及 段 的 其 他 属性 。ELF 文 件 的 段 结构 就 是 由 段 表决 定 的 ， 
编译 器 、 链 接 器 和 加 载 器 都 是 依靠 段 表 来 定位 和 访问 各 个 段 的 属性 的 。 











段 的 类 型 包括 : 
PROGBITS: 程序 内 容 ， 包 括 代码 、 数 据 和 调试 信息 。 


NOBITS: 类 似 于 PROGBITS， 但 是 在 文件 本 身 中 不 分 配 空间 。 用 于 在 程序 加 载 时 分 配 空间 的 BSS 数 据 。 





SYMTAB 和 DYNSYM: 符号 表 。SYMTAB 包 含 所 有 的 符号 并 用 于 普通 的 链接 器 ， 而 DYNSYM 包 含 那些 用 于 动态 链接 的 符号 (第 二 个 符号 表 要 在 运行 时 加 载 到 内 
存 中 ， 所 以 要 尽 可 能 小 ) 。 





STRTAB: 字符 串 表 。ELF 文 件 经 常 为 不 同 的 用 途 包含 不 同 的 字符 串 表 ， 比 如 段 名 称 、 普 通 符号 名 称 和 动态 链接 名 称 。 


REL 和 RELA: 重 定位 信息 。REL 将 重 定位 值 加 到 存储 在 代码 或 者 数据 中 的 基地 址 值 上 ， 而 RELA 在 自身 中 已 保存 了 重 定位 需要 的 基地 址 值 。 














DYNAMIC#QHASH: 动态 链接 信息 和 运行 时 符号 哈 希 表 。 





段 表 定义 里 用 到 了 三 个 标志 位 : ALLOC， 意 思 是 当 程序 加 载 时 段 要 占据 内 存 ; WRITE， 意 思 是 该 段 加 载 后 是 可 写 的 ; EXECINSTR， 意 思 是 该 段 包 含 可 执行 的 机 
器 码 。 


一 个 典型 的 可 重 定位 可 执行 文件 有 10 多 个 段 。 


有 以 下 一 些 段 : 





text: 具有 ALLOC 和 EXECINSTR 属 性 的 PROGBITS 类 型 的 段 ， 已 编译 程序 的 机 器 代码 。 











data: 具有 ALLOC 和 WRITE 属性 的 PROGBITS 类 型 的 段 ， 已 初始 化 的 全 局 C 变 量 。 而 局 部 C 变 量 在 运行 时 保存 在 栈 中 ， 既 不 出 现在 .data 段 中 ， 也 不 出 现在 .bss 段 





.rodata: 具有 ALLOC 属 性 的 PROGBITS 类 型 的 段 。 只 读 属 性 的 ， 比 如 printf 语 句 中 的 字符 串 和 开关 语句 的 跳 转 表 。 





.bss: 具有 ALLOC 和 WRITE 属性 的 NOBITS 类 型 的 段 。 未 初始 化 的 全 局 C 变 量 。 目 标 文 件 格式 区 分 初始 化 和 未 初始 化 变量 是 为 了 空间 效率 : BSS 段 在 文件 中 不 占据 
空间 ， 因 此 是 NOBITS， 但 是 在 运行 时 是 可 分 配 空间 的 ， 所 以 是 ALLOC。 





.rel.text、.rel.data 和 .rel.rodata: 每 个 都 是 REL 或 RELA 类 型 。 分 别 对 应 text 段 、data 段 和 rodata 段 的 重 定 位 信息 。 





:init 和 .fini: 都 是 具有 ALLOC 和 EXECINSTR 属 性 的 PROGBITS 类 型 的 段 。 它 们 和 .text 段 类 似 ， 但 分 别 是 程序 启动 和 终结 时 执行 的 代码 。C 和 Fortran 不 需要 这 些 ， 
而 对 于 有 初始 和 终止 函数 的 全 局 变量 的 C+ + 来 说 是 必须 的 。 





.symtab 和 .dynsym: 分 别 是 SYMTAB 和 DYNSYM 类 型 ， 对 应 普通 的 和 动态 链接 符号 表 。 动 态 链接 器 符号 表 有 ALLOC 属 性 ， 因 为 它 在 运行 时 是 可 加 载 的 。 








.strtab 和 .dynstr: 都 是 STRTAB 类 型 ， 用 于 符号 表 的 名 称 字 符 串 或 者 用 于 段 表 的 段 名 称 。.dynstr 段 为 动态 链接 器 符号 表 的 字符 串 ， 因 为 在 运行 时 加 载 所 以 有 
ALLOC 属 性 。 


还 有 一 些 特殊 的 段 ， 比 如 .got (全 局 偏 移 量 表 ) 和 用 于 动态 链接 的 .plt (过 程 链 接 表 ) ; .debug 包 含 用 于 调试 器 的 符号 ; .line 包 含 用 于 调试 器 的 源 代码 行 号 和 目 
标 代 码 位 置 的 映射 关系 ，.comment 包 含 了 版 本 控制 序号 的 文档 字符 串 。 





下 面 我 们 来 看 一 下 具体 的 段 。 


bash-4.2# arm-fsl-linux-gnueabi-readelf -S simpleelf.o 
There are 12 section headers, starting at offset 0x178: 
Section Headers: 


[Nr] Name Type AddroOff Size ES FlgLkInf Al 

[ 0] NULL 00000000 000000 000000 00 0 0 0 
[ 1] .text PROGBITS 00000000 000034 000088 00 AX 0 0 4 
[ 2] .rel.text REL 00000000 000510 000038 08 10 1 4 
[ 3] .data PROGBITS 00000000 0000bc 000008 00 WA 0 0 4 
[ 4] .bss NOBITS 00000000 0000c4 000004 00 WA 0 0 4 
[ 5] .rodata PROGBITS 00000000 0000c4 000004 00 A 0 0 4 
[ 6] «comment PROGBITS 00000000 0000c8 00001f 01 MS 0 0 1 
[ 7] .note.GNU-stack PROGBITS 00000000 0000e7 000000 00 0 o1 


[ 8] .ARM.attributes ARM ATTRIBUTES 00000000 0000e7 000030 00 0 o1 
[ 9] .shstrtab STRTAB 00000000 000117 000061 00 0 o1 
[10] .symtab SYMTAB 00000000 000358 000170 10 11 18 4 
[11] .strtab STRTAB 00000000 0004c8 000048 00 Oe 404 21, 
Key to Flags 


t 
W (write), A (alloc), X (execute), M (merge), S (strings) 
I (info), L (link order), G (group), x (unknown) 

O (extra OS processing required) o (OS specific), p (processor specific) 


命令 的 第 一 句 就 反映 了 共有 12 个 段 ， 段 表 的 开始 位 置 是 0x178， 段 表 由 12 个 元 素 的 数组 组 成 。ELF 段 表 的 这 个 数组 的 第 一 个 元 素 是 无 效 的 段 描述 符 ， 类 型 为 
NULL， 除 此 之 外 每 个 段 描述 符 都 对 应 于 一 个 段 ， 所 以 共有 11 个 有 效 的 段 。 


从 上 面 列表 的 表 头 中 可 以 看 到 10 项 ， 和 结构 体 的 10 个 成 员 正好 一 一 对 应 。 





sh_name; Name 
sh_type; Type 
sh_ flags; Flg 
sh_addr; Addr 
sh_offset; off 
sh_size; Size 
sh link; Lk 

sh info; Inf 
sh_addralign; Al 
sh_entsize; ES 
根据 每 个 段 的 偏 移 量 和 大 小 ， 我 们 可 以 画 出 ELF 文 件 的 构成 图 如 图 6-2 所 示 。 


而 simpleelf.o 的 文件 大 小 正好 就 是 0x548=1352 个 字 节 。 








段 的 名 称 仅仅 在 编译 和 链接 过 程 中 有 意义 ， 但 它 不 能 真正 地 表示 段 的 类 型 。 对 于 编译 器 和 链接 器 而 言 ， 主 要 决定 段 的 属性 的 是 段 的 类 型 (sh_type) 和 有 段 的 标志 
位 (sh_type) 。 同 样 在 elf.h 头 文件 中 有 如 下 定义 : 


ELF Header size=0x34 
e shoff=0x178 

text offset=0x34 
Size=0x88 


data offset=O0xbe 
Size=0x8 


rodata offset=0xc4 
Size=0x4 


comment offset=Oxc8 
Size=0x1f 


.ARM attributes offset=O0xe7 
Size=0x30 


shstrtab offset=0x117 
Size=0x61 


Section Table offset=0x178 
Size=40* 12=480=0x1E0 


.symtab offset=0x358 
Size=0x170 


.Strtab offset=0x4c8 
Size=0x48 


tel.text offset=0x510 
.Size=0x38 


一 0x00000548 


图 6-2 ELEF 文 件 构成 图 


0x00000000 


0x00000034 


0x000000be 


0x000000c4 


0x000000c8 


0x000000e7 


0x00000117 


0x00000178 


0x00000358 


0x000004c8 


0x00000510 


























/* Legal values for sh type (section type). */ 

define SHT NULL 加 0 /* Section header table entry unused */ 
define SHT PROGBITS 1 /* Program data */ 

define SHT SYMTAB 2 /* Symbol table */ 

define SHT STRTAB 3 /* String table */ 

define SHT RELA 4 /* Relocation entries with addends */ 
define SHT HASH 5 /* Symbol hash table */ 

define SHT DYNAMIC 6 /* Dynamic linking information */ 
define SHT NOTE 7 /* Notes */ 

define SHT NOBITS 8 /* Program space with no data (bss) */ 
define SHT_REL 9 /* Relocation entries, no addends */ 
define SHT SHLIB 10 /* Reserved */ 

define SHT DYNSYM 11 /* Dynamic linker symbol table */ 
define SHT INIT ARRAY 14 /* Array of constructors */ 

define SHT FINI ARRAY 15 /* Array of destructors */ 

define SHT PREINIT ARRAY 16 /* Array of pre-constructors */ 
define SHT GROUP 17 /* Section group */ 

define SHT SYMTAB SHNDX 18 /* Extended section indeces */ 
define SHT N 19 /* Number of defined types. */ 
define SHT LOOS 0x60000000 /* Start OS-specific. */ 

define SHT GNU ATTRIBUTES Ox6fffff£5 /* Object attributes. */ 

define SHT GNU HASH 0x6ffffff6 /* GNU-style hash table. */ 

define SHT GNU LIBLIST Ox6ffffff7 /* Prelink library list */ 

define SHT CHECKSUM 0x6ffffff8 /* Checksum for DSO content. */ 
define SHT LOSUNW Ox6ffffffa /* Sun-specific low bound. */ 
define SHT SUNW move Ox6ffffffa 

define SHT SUNW COMDAT Ox6ffffffb 

define SHT SUNW syminfo Ox6fffffic 

define SHT GNU verdef Ox6ffffffd /* Version definition section. */ 
define SHT GNU verneed Ox6ffffffe /* Version needs section. */ 


#define SHT GNU versym Ox6fffffff /* Version symbol table. */ 


#define SHT HISUNW Ox6fffffff /* Sun-specific high pound. */ 
#define SHT HIOS Ox6fffffff /* End OS-specific type */ 

#define SHT LOPROC 0x70000000 /* Start of processor-specific */ 
#define SHT HIPROC Ox7£f£ffLLE /* End of processor-specific */ 
#define SHT LOUSER 0x80000000 /* Start of application-specific */ 
#define SHT HIUSER Ox8f£ffffff /* End of application-specific */ 





而 段 的 标志 位 (sh_flag) 表示 该 段 在 进程 虚拟 地 址 空间 中 的 属性 ， 比 如 是 否 可 写 、 是 否 可 执行 等 。 在 elf.h 中 的 定义 如 下 : 




















/* Legal values for sh flags (section flags). */ 

#define SHF WRITE > (1 << 0) /* Writable */ 

define SHF ALLOC (1 << 1) /* Occupies memory during execution */ 

#define SHF EXECINSTR (1 << 2) /* Executable */ 

define SHF MERGE (1 << 4) /* Might be merged */ 

#define SHF STRINGS (1 << 5) /* Contains nul-terminated strings */ 

define SHF_INFO_LINK (1 << 6) /* ‘sh info' contains SHT index */ 

define SHF LINK ORDER (i <<. 7): /* Preserve order after combining */ 

#define SHF OS NONCONFORMING (1 << 8) /* Non-standard OS specific handling 
required */ 

#define SHF GROUP (1 << 9) /* Section is member of a group. */ 

define SHF TLS (1 << 10) /* Section hold thread-local data. */ 

#define SHF MASKOS 0x0££00000 /* OS-specific. */ 

define SHF MASKPROC 0x£0000000 /* Processor-specific */ 

#define SHF ORDERED (1 << 30) /* Special ordering requirement 
(Solaris) . Ey 

#define SHF EXCLUDE (1 << 31) /* Section is excluded unless 











referenced or allocated (Solaris) .*/ 





6.3 ”符号 表 结构 


ELF 文 件 中 的 符号 表 是 文件 中 的 一 个 段 ， 段 名 一 般 叫 “.symtab” 。 符 号 表 的 结构 很 简单 ， 是 一 个 名 为 Elf32_Sym 的 数组 ， 每 个 Elf32_Sym 结 构 对 应 一 个 符号 。 
Elf32_Sym 的 结构 定义 如 下 : 





/* Symbol table entry. */ 


typedefstruct 

{ 
Elf32 Word st _ name; /* Symbol name (string tbl index) */ 
Elf32 Addr st value; /* Symbol value */ 
Elf32_ Word st_size; /* Symbol size */ 
unsigned char st_info; /* Symbol type and binding */ 
unsigned char st_other; /* Symbol visibility */ 
Elf32 Section st_shndx; /* Section index */ 

} E1£32_Sym; ~ 





st_name 是 字符 串 表 中 的 字 节 偏 移 ， 指 向 符号 的 以 nul 结 尾 的 字符 串 名 字 。st_value 是 符号 的 地 址 。 对 于 可 重 定位 的 模块 来 说 ，st_value 是 距 定 义 目 标的 节 的 起 始 
位 置 的 偏 移 。 对 于 可 执行 目标 文件 来 说 ， 该 值 是 一 个 运行 时 的 绝对 地 址 。st_size 是 目标 的 大 小 。st_info 是 符号 类 型 和 绑 定 信息 ， 符 号 类 型 通常 是 数据 ， 或 是 函数 。 绑 
定 信息 表示 符号 是 本 地 的 还 是 全 局 的 。st_other 目 前 为 0。st_shndx 表 示 符号 所 在 的 段 








符号 类 型 和 绑 定 信息 (st_info) st_info 包 含 符号 类 型 和 绑 定 信息 。 





符号 类 型 的 定义 如 下 : 

/* Legal values for ST TYPE subfield of st info (symbol type). */ 

#define STT NOTYPE 0 /* Symbol type is unspecified */ 
define STT OBJECT 1 /* Symbol is a data object */ 


#define STT FUNC 
define STT SECTION 
#tdefine STT FILE 
define STT COMMON 


2 /* Symbol is a code object */ 

3 /* Symbol associated with a section */ 
4 /* Symbol's name is file name */ 

Zz 5 /* Symbol is a common data object */ 
define STT TLS 6 /* Symbol is thread-local data object*/ 
#define STT NUM 7 /* Number of defined types. */ 
define STT LOOS 10 /* Start of OS-specific */ 

#define STT GNU IFUNC 10 /* Symbol is indirect code object */ 
define STT HIOS 12 /* End of OS-specific */ 

#define STT LOPROC 13 /* Start of processor-specific */ 
define STT HIPROC 15 /* End of processor-specific */ 




















绑 定 信息 的 定义 如 下 : 





/* Legal values for ST BIND subfield of st info (symbol binding). */ 





#define STB LOCAL 0 /* Local symbol */ 

#define STB GLOBAL 1 /* Global symbol */ 

#define STB WEAK 2 /* Weak symbol */ 

#define STB NUM 3 /* Number of defined types. */ 





如 果 符 号 定义 在 当前 的 目标 文件 中 ， 那 么 st_shndx 成 员 表示 符号 所 在 的 段 在 段 表 中 的 索引 。 有 三 个 特殊 的 伪 节 (pseudo section) ， 它 们 在 段 表 中 是 没有 条 目 
AY: ABS 表 示 不 该 被 重 定位 的 符号 ; UNDEF 代 表 未 定义 的 符号 ， 表 示 该 符号 在 本 目标 模块 中 被 引用 到 ， 但 是 却 在 其 他 地 方 定义 的 符号 ; COMMON 表 示 还 未 分 配 位 
置 的 未 初始 化 的 数据 目标 。 


在 elf.h 中 的 定义 如 下 : 





/* Special section indices. 
#define SHN UNDEF 
#define SHN ABS 
#define SHN COMMON 


s7 


0 
Oxfff1 


0 


xfff2 


/* Undefined section */ 


/* Associated symbol is absolute */ 


/* Associated symbol is common */ 





在 分 析 时 ， 我 们 给 出 两 个 C 文 件 ， 


main.c 的 源码 如 下 : 


一 个 是 main.c， 一 个 是 add.c。 





void add() 


int 


array[2] = {1, 2 


int main() 


add () ; 
return 0; 


}; 





add.c 的 源码 如 下 : 





extern int array[]; 


int 
int 


a= 3; 
b; 


void add (void) 


{ 


int c; 


b = array[1]; 


Cc 


"il 
w 
+ 
oF 





下 面 给 出 main.o 中 的 符号 表 : 





bash-4.2# arm-fsl-linux-gnueabi-readelf -s main.o 
Symbol table '.symtab' contains 13 entries: 


Num: 


WODAKDOTHBWNHEO 


Value 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 


: 00000000 
: 00000000 
: 00000000 


Size 


口 Woo 口 口 口 口 口 口 口 口 口 口 


Type 
NOTYPE 
FILE 
SECTION 
SECTION 
SECTION 
NOTYPE 
NOTYPE 
SECTION 
SECTION 
SECTION 
OBJECT 
FUNC 
NOTYPE 


Bind 


LOCAI 
LOCAI 
LOCAI 
LOCAI 
LOCAI 
LOCAI 
LOCAI 
LOCAI 
LOCAI 
LOCAL 
GLOBAI 
GLOBAL 
GLOBAL 


EA tt tt ratte 





(x 





Vis 


DE. 
DE. 
DE. 
DE. 
DE. 
DE. 
DE. 
DE. 
DE. 
DE. 
DE. 
DE. 
DE. 


FAU. 
FAU. 
FAU. 
FAU. 
FAU. 
FAU. 
FAU. 
FAU. 
FAU. 
FAU. 
FAU. 
FAU. 





FAU. 


LT 
LT 
LT 
LT 
LT 
LT 
LT 
LT 
LT 
LT 
LT 
LT 
LT 





gHoxwaonuswnpgE 
已 no 


Name 


main.c 


$d 
$a 


array 
main 
add 





上 面 的 输出 格式 与 Ef32_Sym 结 构 体 的 成 员 几 乎 一 一 对 应 。 第 一 列 Num 表 示 符 号 表 数 组 的 下 标 ， 从 0 开始 ， 共 13 个 符号 ; 第 二 列 Value 就 是 符号 值 st_value; B= 
列 Size 为 符号 大 小 st_size; 第 四 列 Type 和 第 五 列 Bind 分 别 对 应 于 st_info 中 的 符号 类 型 和 绑 定 信息 ; 


是 st_shndx; 最 后 一 列 Name 就 是 符号 名 称 st_name。 


这 里 给 出 段 头 表 ， 方便 分 析 : 


第 六 列 Vis 目 前 在 C 语 言 中 未 使 用 ， 可 以 暂时 忽略 ; 第 七 列 Ndx 就 





bash-4.2# arm-fsl-linux-gnueabi-readelf -S main.o 
There are 11 section headers, starting at offset 0x104: 
Section Headers: 


Nr 
0 








| 
Oo~awm 必 wmN 


Name 


-text 

.rel .text 

.data 

-bss 

. comment 
.note.GNU-stack 
.ARM.attributes 
.Shstrtab 
.Symtab 

.strtab 


Key to Flags: 


Type 
NULL 
PROGBITS 
REL 
PROGBITS 
NOBITS 
PROGBITS 
PROGBITS 


ARM ATTRIBUTES 


STRTAB 
SYMTAB 
STRTAB 


Addroff 

00000000 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 
00000000 


000000 
000034 
0003ac 
000054 
00005c 
00005c 
00007b 
00007b 
0000ab 
0002be 
00038c 


I (info), L (link order), G (group), x (unknown) 


Size 
000000 
000020 
000010 
000008 
000000 
00001f 
000000 
000030 
000059 
0000d0 
00001da 


00 
00 
08 
00 
00 
01 
00 
00 
00 
10 
00 


W (write), A (alloc), X (execute), M (merge), S (strings) 


ES FlgLkInf Al 


AX 


WA 
WA 
MS 


Oo 


人 
jo) 


oo 


Le 


PAPPPPPAAAO 


O (extra OS processing required) o (OS specific), p (processor specific) 





在 main.o 中 ， 我 们 看 到 一 个 关于 全 局 变量 array 定 义 的 条 目 ， 它 的 Ndx 为 3， 即 是 .data 段 中 偏 移 为 0 (value) 处 的 8 字 节 目标 。 其 后 是 全 局 符号 main 的 定义 ， 它 
的 Ndx 为 1， 即 是 .text 段 中 偏 移 为 0 处 的 32 字 节 函 数 。 最 后 是 一 个 对 外 部 符号 add 的 引用 。 


类 似 地 ， 给 出 add.o 的 符号 表 : 





bash-4.2# arm-fsl-linux-gnueabi-readelf -s add.o 
Symbol table '.symtab' contains 15 entries: 
Num: Value 


ds 00000000 
1: 00000000 


Size T 
0 Ni 
0 F 


ype 
OTYPE 
ILE 


Bind Vis 


LOCAL 
LOCAL 





DEFAULT 
DEFAULT 


Ndx Name 


UND 


ABS add.c 











2 00000000 0 SECTION LOCAL DEFAULT 1 
3 00000000 0 SECTION LOCAL DEFAULT 3 
4: 00000000 0 SECTION LOCAL DEFAULT 4 
53 00000000 0 NOTYPE LOCAL DEFAULT 3 $d 
63 00000000 0 NOTYPE LOCAL DEFAULT 1 $a 
a. 00000040 0 NOTYPE LOCAL DEFAULT 1 $d 
B: 00000000 0 SECTION LOCAL DEFAULT 6 
号 00000000 0 SECTION LOCAL DEFAULT 5 
10: 00000000 0 SECTION LOCAL DEFAULT 7 
11: 00000000 4 OBJECT GLOBAL DEFAULT 3a 
12: 00000004 4 OBJECT GLOBAL DEFAULT COM b 
13: 00000000 76 FUNC GLOBAL DEFAULT 1 add 
14: 00000000 0 NOTYPE GLOBAL DEFAULT UND array 





第 一 个 是 关于 全 局 符号 a 定 义 的 条 目 ， 它 位 于 .data 段 偏 移 为 0 处 开始 的 一 个 4 字 节 的 已 初始 化 目标 。 下 一 个 全 局 符号 b 是 一 个 未 初始 化 的 4 字 节 数据 目标 (要 求 4 字 
节 对 齐 ) ， 最 终 当 这 个 模块 被 链接 时 它 将 作为 一 个 .bss 目 标 分 配 。 再 接 下 来 是 全 局 符号 add， 位 于 .text 段 中 偏 移 为 0 处 的 76 字 节 冰 数 。 最 后 一 个 是 对 外 部 符号 array 的 
引用 。 


上 面 介绍 的 是 编译 过 程 中 根据 变量 或 者 函数 名 产生 的 一 般 符 号 ， 下 面 介 绍 一 些 特殊 的 符号 。 


当 我 们 使 用 Id 作为 链接 器 来 链接 产生 可 执行 文件 时 ， 它 会 为 我 们 定义 很 多 特殊 的 符号 ， 这 些 符号 并 没有 在 程序 中 定义 ， 但 是 可 以 在 程序 中 直接 声明 并 且 引 用 ， 我 
们 把 这 些 符号 称 为 特殊 符号 。 后 续 在 讲 到 链接 脚本 (linker script) 时 也 会 提 到 。 链 接 器 会 在 将 程序 最 终 链接 成 可 执行 文件 时 将 其 解析 成 正确 的 值 ， 注 意 ， 只 有 在 使 
用 ld 链接 产生 最 终 可 执行 文件 时 这 些 符号 才 会 存在 。 几 个 很 有 代表 性 的 特殊 符号 在 这 里 说 明 一 下 。 


"executable_start， 该 符号 为 程序 起 始 地 址 ， 注 意 不 是 入 口 地 址 ， 是 程序 的 最 开始 的 地 址 。 
"etext、_etext 或 etext， 该 符号 为 代码 段 结束 地 址 ， 即 代码 段 最 末尾 的 地 址 。 

- _edata 或 edata， 该 符号 为 数据 段 结束 地 址 ， 即 数据 段 最 末尾 的 地 址 。 

- _end 或 cnd， 该 符号 为 程序 结束 地 址 。 

我 们 在 分 析 完 目标 文件 后 ， 就 只 剩 下 最 后 一 步 一 一 链接 。 


通过 前 面 对 ELF 文 件 格式 的 分 析 ， 我 们 对 ELF 目 标 文件 从 整体 轮廓 到 某 些 关键 的 局 部 细节 都 有 了 一 定 的 理解 。 接 下 来 的 问题 是 ， 链 接 器 是 如 何 将 目标 文件 链接 起 来 
形成 可 执行 文件 的 ”这 就 是 下 面 要 讲 的 链接 的 核心 内 容 : 存储 空间 分 配 和 静态 链接 。 


6.4 存储 空间 分 配 


链接 器 的 首要 任务 是 存储 分 配 。 一 旦 分 配 了 存储 空间 后 ， 链 接 器 就 可 以 继续 进行 符号 绑 定 和 代码 调整 。 从 前 面 分 析 ELF 文 件 格式 或 者 从 链接 脚本 的 输入 段 和 输出 
段 的 介绍 ， 我 们 可 以 知道 可 执行 文件 中 的 代码 段 和 数据 段 都 是 由 输入 的 目标 文件 中 合并 而 来 的 。 那 么 ， 对 于 多 个 输入 目标 文件 ， 链 接 器 如 何 将 它们 的 各 个 段 合并 到 输 
出 文件 呢 ? 

存储 分 配 的 基本 问题 是 很 简单 的 ， 但 处 理 计 算 机 体系 结构 和 编程 语言 语义 特性 的 细节 就 让 问题 复杂 了 起 来 。 存 储 分 配 的 大 多 数 工作 都 可 以 通过 优雅 和 相对 架构 无 
关 的 方法 来 处 理 ， 在 这 里 我 们 仅仅 讨论 至 此 。 


6.5 EEES 





重 定位 是 将 符号 定义 和 符号 引用 链接 的 过 程 。 举 个 例子 ， 当 程序 调用 一 个 函数 ， 相 关 的 调用 指令 必须 将 控制 权 转 移 到 正确 的 执行 地 址 处 。 换 句 话说 ， 重 定位 信息 
必须 包含 描述 如 何 修改 它们 的 段 内 容 的 信息 ， 所 以 允许 可 执行 对 象 文 件 和 共享 对 象 文件 为 程序 映像 保存 正确 的 信息 。 








6.6 静态 链接 和 重 定位 


为 了 更 好 地 说 明 链 接 时 如 何 工作 的 一 些 重要 知识 点 ， 下 面 给 出 一 个 示例 ， 它 包含 两 个 源 文件 main.c 和 add.c。 逊 数 main0 调 用 add0 完 成 外 部 全 局 数据 和 数组 
array 中 的 元 素 的 加 法 运算 。 


main.c 的 代码 如 下 : 


代码 清单 6-2: main.c 的 代码 


void add(); 
int array[2] = {1, 2}; 
int main () 


add () ; 
return 0; 


} 


add.c 的 代码 如 下 : 


代码 清单 6-3: add.c 的 代码 


externint array[]; 
int a = 3; 

int b; 

void add(void) 


int c 
b = array[1] 
c=at+b; 


UNIX ld 这 样 的 链接 器 以 一 组 可 重 定位 目标 文件 和 命令 行 参数 作为 输入 ， 生 成 一 个 完全 链接 的 可 以 加 载 和 运行 的 可 执行 目标 文件 作为 输出 。 在 链接 过 程 中 ， 目 标 
文件 之 间 相 互 拼合 实际 上 就 是 目标 文件 之 间 对 地 址 的 引用 ， 即 对 函数 和 变量 的 地 址 的 引用 。 比 如 目标 文件 B 用 到 了 目标 文件 A 中 的 函数 swap， 那 么 我 们 就 称 目标 文件 
A 定 义 了 函数 swap， 而 目标 文件 B 引 用 了 目标 文件 A 中 的 函数 swap。 这 个 概念 同样 适用 于 变量 。 每 个 函数 或 变量 都 有 自己 独特 的 名 称 ， 才 能 避免 链接 过 程 中 不 同 变量 
和 函数 之 间 的 混淆 。 在 链接 中 ， 我 们 将 函数 和 变量 统称 为 符号 ， 函 数 名 或 变量 名 就 是 符号 名 。 


为 了 构造 可 执行 文件 ， 链 接 器 必须 完成 两 个 主要 任务 : 
1) 符号 解析 。 目 标 文件 定义 和 引用 符号 。 符 号 解析 的 目的 是 将 每 个 符号 引用 刚好 和 一 个 符号 定义 联系 起 来 。 


2) 重 定位 。 编 译 器 和 汇编 器 生成 从 地 址 0 开始 的 代码 和 数据 段 。 链 接 器 通过 定义 每 个 符号 从 而 将 其 与 一 个 存储 器 位 置 联系 起 来 ， 然 后 修改 所 有 对 这 些 符号 的 引 
用 ， 使 得 它们 指向 这 个 存储 器 位 置 ， 从 而 重 定位 这 些 段 。 


6.7 本章 小 结 





本 章 介绍 的 编译 和 链接 对 于 大 部 分 理工 科 背 景 ( 非 计算 机 或 者 软件 工程 专业 ) 的 读者 来 说 是 比较 陌生 的 ， 因 此 请 专注 学 习 这 一 章 的 内 容 ， 理 解 该 章 内 容 不 仅仅 对 
理解 BootLoader 有 帮助 ， 而 且 对 理解 整个 计算 机 系统 都 有 意义 。 更 多 深入 的 细节 请 读者 参考 《Linker and Loader》 一 书 。 





第 / 章 ”链接 脚本 


本 章 导读 


前 面 的 章节 介绍 了 编译 器 和 链接 器 的 使 用 以 及 分 析 了 ELF 文 件 格式 。 这 一 章 介绍 整个 编译 链接 过 程 中 容易 忽略 的 知识 点 





链接 脚本 。 








7.1 节 介绍 链接 脚本 的 基本 概念 。 (在 计算 机 世界 中 ， 其 实 每 一 次 链接 过 程 都 是 由 链接 脚本 控制 的 。) 
7.2 节 介绍 链接 脚本 的 格式 。 (该 脚本 是 由 链接 器 命令 语言 书写 的 。) 

7.3 节 列举 一 个 简单 的 链接 脚本 示例 。 

7.4 节 详细 介绍 链接 脚本 的 命令 。 

7.5 节 详细 介绍 在 链接 脚本 中 为 符号 分 配 值 的 方法 。 

7.6 节 介绍 链接 脚本 中 的 段 命令 。 

7.7 节 介绍 链接 脚本 中 的 内 存 命令 。 

7.8 节 介绍 链接 脚本 的 表达 式 。 


链接 脚本 的 主要 目的 是 描述 输入 文件 中 的 段 如 何在 输出 文件 中 组 装 ， 并 控制 输出 文件 的 存储 布局 。 绝 大 多 数 链接 脚本 都 做 这 个 事情 。 然 而 在 必要 的 时 候 ， 链 接 肢 


本 也 可 以 使 用 接 下 来 描述 的 命令 直接 指定 链接 器 执行 许多 其 他 的 操作 。 


链接 器 必须 要 用 一 个 链接 脚本 。 如 果 不 提供 的 话 ， 链 接 器 会 使 用 默认 的 链接 脚本 。 可 以 用 “--verbose” 命 令 行 选项 来 显示 默认 的 链接 脚本 。 在 Linux 下 输 
入 “arm-fsl-linux-gnueabi-ld--verbose” 会 显示 出 当前 使 用 的 默认 脚本 ， 该 脚本 非常 复杂 ， 幸 运 的 是 链接 BootLoader 的 脚本 通常 要 简单 得 多 。 尽 管 如 此 ， 我 们 仍 
然 需要 全 面 地 了 解 链接 脚本 的 更 多 细节 。 固 定 的 命令 行 选项 ， 比 如 “-m 或 “-N” 会 影响 默认 的 链接 脚本 。 也 可 以 用 “-T” 命 令 行 选项 来 指定 自己 的 链接 脚本 。 这 时 
候 ， 指 定 的 链接 脚本 会 蔡 代 默认 的 链接 脚本 。 





7.1 链接 脚本 的 基本 概念 


我 们 需要 定义 一 些 基本 内 容 和 词汇 来 描述 链接 脚本 的 语言 。 
链接 器 将 多 个 输入 文件 合并 为 一 个 输出 文件 。 输 出 文件 和 每 个 输入 文件 都 是 一 种 特定 的 文件 格式 ， 称 为 对 象 文件 格式 。 文 件 称 为 对 象 文件 。 输 出 文件 称 为 可 执行 
文件 ， 在 这 里 我 们 也 称 为 一 个 对 象 文件 ， 每 个 对 象 文件 有 一 系列 段 。 这 里 我 们 将 输入 文件 中 的 段 称 为 输入 段 ， 将 输出 文件 的 段 称 为 输出 段 。 


对 象 文件 的 每 个 段 都 有 一 个 名 称 和 大 小 。 大 多 数 段 也 有 一 个 相关 的 数据 块 ， 称 为 段 内 容 。 一 个 段 可 以 标记 为 可 加 载 的 ， 意 味 着 当 输出 文件 运行 时 内 容 必须 要 加 载 
到 内 存 中 。 一 个 没有 内 容 的 段 可 以 是 可 分 配 的 ， 意 味 着 在 内 存 中 留 出 一 块 区 域 ， 但 是 没有 内 容 会 加 载 到 (有 些 情况 下 这 块 内 存 区 域 都 要 写 0) 。 既 不 是 可 加 载 也 不 是 
可 分 配 的 段 通常 包含 一 些 调试 信息 。 








每 一 个 可 加 载 或 者 可 分 配 的 输出 段 都 有 两 个 地 址 。 第 一 个 是 虚拟 内 存 地 址 ， 缩 写 为 VMA， 这 个 地 址 是 输出 文件 运行 时 输出 段 的 地 址 。 第 二 个 地 址 是 加 载 内 存 地 
址 ， 缩 写 为 LMA， 这 个 地 址 是 段 被 加 载 的 地 址 。 大 多 数 情 况 下 这 两 个 地 址 是 一 致 的 。 举 个 它们 可 能 不 同 的 例子 : 一 个 数据 段 加 载 到 ROM 中 ， 然 后 当 程序 启动 时 复制 
到 RAM 中 (这 个 技术 通常 用 于 在 基于 ROM 的 系统 中 初始 化 全 局 变量 ) 。 在 该 种 情况 下 OM 地 址 就 是 LMA，RAM 地 址 就 是 VMA。 使 用 objdump 命 令 和 -h 选 项 可 以 
查看 对 象 文件 中 的 各 个 段 。 








每 个 对 象 文件 都 有 一 串 符号 ， 称 为 符号 表 。 符 号 可 以 是 定义 的 或 者 未 定义 的 。 每 个 符号 有 一 个 名 字 ， 每 个 定义 的 符号 有 一 个 地 址 。 如 果 编 译 C 或 C++ 程序 到 一 个 
对 象 文件 ， 会 从 每 个 定义 的 函数 、 全 局 或 静态 变量 中 得 到 一 个 定义 的 符号 。 输 入 文件 中 引用 的 每 个 未 定义 的 函数 或 者 全 局 变量 都 会 成 为 一 个 未 定义 符号 。 可 以 使 用 
nm 命令 或 者 使 用 带 -t 选 项 的 objdump 命 令 来 查看 对 象 文件 中 的 符号 。 


7.2 ”链接 脚本 格式 


链接 脚本 是 文本 文件 。 


一 个 链接 脚本 就 是 一 系列 命令 。 每 条 命令 可 以 是 一 个 带 参数 的 关键 字 ， 也 可 以 是 符号 的 分 配 。 其 中 ， 分 号 用 于 分 隔 命 令 ， 而 空格 被 忽略 。 





如 文件 名 或 格式 名 的 字符 捉 可 以 直接 输入 。 如 果 文件 名 包含 诸如 逗号 的 字符 ， 可 以 将 文件 名 放 在 双 引号 中 。 因 此 在 文件 名 中 不 能 使 用 双 引 号 。 


如 同 C 语 言 中 将 “/*” 和“*/” 之 间 的 内 容 当做 注释 ， 同 样 注释 不 起 任何 作用 ， 当 做 空格 处 理 。 





7.3 简单 的 链接 脚本 示例 


相当 多 的 链接 脚本 是 相当 简单 的 。 
最 简单 的 链接 脚本 只 有 一 个 命令 : SECTIONS 该 命令 用 于 描述 输出 文件 的 内 存 布局 。 


SECTIONS 命 令 是 个 很 强大 的 命令 ， 这 里 我 们 简单 地 描述 一 下 它 的 使 用 。 先 假定 程序 只 包含 代码 、 初 始 化 的 数据 和 未 初始 化 的 数据 ， 它 们 对 应 在 “.text”、 
“.data” 和 “.bss” 段 中 。 我 们 假定 在 输入 文件 中 也 只 有 这 些 段 。 


在 这 个 例子 中 ， 我 们 设 定 代码 加 载 的 地 址 为 0x10000， 数 据 开 始 的 地 址 为 0x8000000。 这 个 链接 就 这 么 写 : 


SECTIONS 
{ 


. = 0x10000; 
etext : { *(.text) } 
. = 0x8000000; 
-data : { *(.data) } 
-bss : { *(.bss) } 

} 


关键 字 SECTIONS 就 当做 SECTION 命 令 ， 后 面 跟着 花 括号 中 的 一 系列 符号 分 配 和 输出 段 的 描述 。 


上 述 例子 中 SECTIONS 命 令 第 一 行 设 定 特殊 符号 “” 的 值 ，“.” 是 位 置 计数 器 。 如 果 不 用 其 他 方式 指定 输出 段 的 地 址 ， 地 址 从 位 置 计数 器 的 当前 值 开始 计算 。 
然后 位 置 计数 器 的 值 增加 输出 段 的 大 小 。 在 SECTIONS 命 令 的 最 开始 ， 位 置 计数 器 的 值 是 0。 


第 二 行 定义 输出 段 “.text”。 冒 号 是 必需 的 格式 。 在 输出 段 的 名 称 后 有 一 个 花 括 号 ， 里 面 可 以 列举 放 入 该 输出 段 的 输入 段 。“*” 是 匹配 任何 文件 名 的 通配符 。 
表达 式 “* (.text) ”表示 所 有 输入 文件 中 的 所 有 “text” AE 


由 于 定义 输出 段 “.text” 时 位 置 计 数 器 的 值 是 0x10000， 链 接 器 会 在 输出 文件 中 将 “.text” 的 地 址 设 定 为 0x10000。 


余下 几 行 定义 输出 文件 中 的 “.data” 和 “.bss” 段 。 链 接 器 将 “.data” 段 放置 在 地 址 0x8000000 处 。 当 链接 器 放置 “.data” 输 出 段 后 ， 位 置 计数 器 的 值 变 为 
0x8000000 加 上 “.data” 输 出 段 的 大 小 。 然 后 链接 器 会 将 “.bss” 输 出 段 紧 跟着 “.data” 输 出 段 放置 。 


链接 器 会 保证 每 个 输出 段 都 是 按 要 求 对 齐 的 。 在 这 个 例子 中 ,为 “text″ 和 “.data” 段 指定 的 地 址 可 能 满足 任何 的 对 齐 要求 ， 但 是 链接 器 可 能 会 
在 “.data” 和 “.bss” 段 中 建立 一 个 小 的 间隔 。 


这 就 是 一 个 简单 但 完整 的 链接 脚本 。 


7.4 简单 的 链接 脚本 命令 
该 节 描 述 简单 的 链接 脚本 命令 : 
文件 命令 : 处 理 文件 的 命令 。 
格式 命令 : 处 理 对 象 文 件 格式 的 命令 。 


区 域 别名 : 为 内 存 区 域 分 配 别 名 。 


杂 类 命令 : 其 他 的 链接 脚本 命令 。 


7.5 ”为 符号 分 配 值 





在 链接 脚本 中 可 以 为 一 个 符号 分 配 值 ， 这 会 定义 这 个 符号 ， 并 在 全 局 范围 内 将 其 放 入 符号 表 。 





7.6 RMS 


段 命令 告诉 链接 器 如 何 映射 输入 端 到 输出 段 中 以 及 如 何在 内 存 中 放置 输出 段 。 
段 命令 的 格式 是 : 


SECTIONS 


sections-command 

sections-command 
http://www. hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15768/OEBPS/Text/... 
} 





共有 四 类 段 命令 : 


. 入 口 点 命令 ENTRY。 


入 口 点 命令 和 符号 分 配 在 前 面 已 经 介绍 过 。 
输出 段 描述 和 履 盖 描述 在 下 面 介绍 。 


如 果 在 链接 脚本 中 没有 使 用 SECTIONS 命 令 ， 链 接 器 会 将 每 个 输入 段 按照 在 输入 文件 中 的 顺序 放 入 同名 的 输出 段 中 。 如 果 所 有 的 输入 端 都 在 第 一 个 文件 中 ， 那 么 
输出 文件 中 段 的 顺序 和 第 一 个 输入 文件 的 顺序 一 致 ， 第 一 个 段 在 地 址 0 处 。 


7.7 内存 命令 








链接 器 的 默认 配置 是 所 有 可 用 的 内 存 都 是 可 分 配 的 。 使 用 MEMORY 命 令 来 修改 这 个 配置 。 


MEMORY 命 令 描 述 在 目标 中 内 存 块 的 位 置 和 空间 大 小 。 可 以 使 用 MEMORY 命 令 来 描述 哪个 内 存 区 域 可 以 被 链接 器 使 用 ， 哪 个 内 存 区 域 不 可 以 被 链接 器 使 用 。 还 
可 以 为 特殊 的 内 存 区 域 分 配 段 。 链 接 器 按照 内 存 区 域 来 设 定 段 地 址 ， 而 且 当 区 域 快 饱和 时 会 发 出 通知 。 链 接 器 不 会 为 了 将 段 放 入 合适 的 区 域 而 打 乱 其 位 置 。 


一 个 链接 脚本 最 多 包含 一 个 MEMORY 命 令 。 然 而 ， 可 以 定义 足够 多 的 内 存 块 。 语 法 格式 是 : 


MEMORY 


name [(attr)] : ORIGIN = origin, LENGTH = len 
http://www. hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15768/OEBPS/Text/... 


其 中 ，name 是 用 在 链接 脚本 中 引用 区 域 的 名 称 ， 在 链接 脚本 外 区 域名 称 是 没有 意义 的 。 区 域名 称 存 储 在 一 个 独立 的 命名 空间 ， 不 会 与 符号 名 、 文 件 名 或 者 段 名 
冲突 。MEMORY 命 令 的 每 个 内 存 区 域 要 有 一 个 确切 的 名 称 ， 然 而 可 以 使 用 REGION_ALIAs 命 令 为 存在 的 内 存 区 域 添加 别名 。 

attr 字 符 串 是 一 个 可 选 的 属性 列表 ， 用 于 指定 是 否 为 一 个 在 链接 脚本 中 没有 明确 映射 的 输入 段 使 用 一 个 特殊 的 内 存 区 域 。 在 SECTIONS 小 节 中 描述 过 ， 如 果 没 有 
为 输入 段 指定 一 个 输出 段 ， 那 么 链接 器 会 按照 输入 段 的 名 称 创建 同名 的 输出 段 。 如 果 定 义 了 区 域 属 性 ， 链 接 器 会 使 用 它们 。 











attr 字 符 串 一 定 只 能 由 下 面 的 字符 组 成 : 


X 可 执行 段 
A 可 分 配 段 
| 已 初始 化 段 
L 和 | 相同 


| 反 转 跟 在 后 面 的 所 有 属性 


7.8 ”链接 脚本 的 表达 式 


链接 脚本 语言 中 的 表达 式 格式 和 C 语 言 中 的 表达 式 是 一 样 的 ， 对 所 有 的 表达 式 求 值 都 是 整数 。 所 有 的 表达 式 求 值 都 是 一 样 的 大 小 ， 当 主机 和 目标 是 32 位 时 就 是 32 
位 的 ， 其 他 情况 下 是 64 位 的 。 可 以 使 用 并 设 定 表达 式 中 的 符号 值 。 


链接 器 定义 了 在 表达 式 中 使 用 的 几 种 有 特定 用 途 的 内 建 函 数 。 


79 ”本 章 小 结 





本 章 非常 详细 地 讲述 了 链接 脚本 ， 请 读者 灵活 掌握 ， 并 与 编译 和 链接 知识 一 起 加 深 理解 ， 做 到 既 能 阅读 U-Boot 工 程 的 链接 脚本 ， 也 能 为 自己 开发 的 汇编 程序 或 
者 BootLoader 代 码 定 制 链接 脚本 。 


第 8 章 ”Linux 下 开发 流水 灯 


本 章 导 读 
前 面 我 们 讲解 了 Linux 下 的 环境 搭建 、 编 译 链接 的 一 些 细节 、ARM 体 系 结构 以 及 汇编 指令 等 。 这 些 都 是 为 深入 理解 BootLoader 做 理论 上 的 准备 。 而 在 讲解 
BootLoader 之 前 ， 可 先 在 Linux 下 编写 最 简单 的 流水 灯 代 码 来 粹 合 前 面 的 理论 。 这 一 章 仅 仅 只 是 抛砖引玉 ， 读 者 可 以 自行 选择 合适 的 硬件 模块 来 实现 前 面 理论 的 融合 。 
8.1 节 简单 介绍 GNU 风 格 下 的 汇编 。 
8.2 节 以 Linux 下 开发 流水 灯 为 例 ， 首 先 介绍 相关 的 硬件 特性 。 
8.3 节 讲述 流水 灯 程 序 的 汇编 实现 。 


8.4 节 讲述 在 Linux 下 如 何 编译 和 链接 流水 灯 的 汇编 代码 。 


8.1 GNU ARM 汇 编 简介 


在 编写 GNU/Linux 下 的 汇编 代码 之 前 ， 我 们 简单 介绍 一 下 GNU ARM 汇 编 风 格 。 在 GNU ARM 汇 编 风 格 中 ， 每 一 汇编 行 都 是 下 面 的 格式 : 





[<label>:] [<instruction or directive>} @ comment 
[< 标签 >: ] [< 指令 或 伪 指令 >} @ 注释 





与 ARM 汇 编 器 不 同 ，GNU 汇 编 器 不 要 求 我 们 缩 进 指令 和 伪 指 令 。 任 何以 冒号 结尾 的 都 被 认为 是 一 个 标签 ， 而 不 一 定 要 在 一 行 的 开始 。 下 面 是 一 个 简单 的 汇编 代 
码 ， 它 定义 了 一 个 返回 两 个 参数 之 和 的 函数 add。 





.Section .text, "x" 


-global add @ give the symbol add external linkage 
add: 
ADD rO, r0, ri @ add input arguments 
MOV pc, lr @ return from subroutine 


@ end of program 





GNU ARM 汇 编 伪 指令 如 表 8-1 所 示 。 


#8-1 GNU ARM 汇 编 伪 指令 介绍 


GNU ARM 汇编 伪 指 令 


„ascii “<string>” 


.asciz “<string>” 


.balign <power_of_2> 
{,<fill_ value> 


{,<max_padding>} } 


.byte <bytel> {,<byte2>} … 


.code <number of bits> 


.else 


.end 


.endif 


.endm 


.endr 


描述 

插入 字符 串 到 目标 文件 中 ,但 不 以 NULL 结尾 
(与 armasm 中 的 DCB 类 似 ) 

与 ascii KW, 但 以 NULL 结尾 

使 地 址 以 <power_ of 2> 字 节 对 齐 。 不 足 之 处 
是 ,用 <fill value> 或 者 默认 值 填充 。 如 果 填 充 字 
节 数 大 于 <max_padding>， 那 么 将 不 会 对 齐 。( 与 
armasm 中 的 ALIGN 类 似 ) 


搬入 字 节 串 到 目标 文件 中 (与 armasm 的 DCB 
类 似 ) 


设置 指令 的 宽度 位 数 。Thumb 指令 是 16 位 ， 
ARM 指令 是 32 位 。( 与 armasm 中 的 CODE16 和 
CODE32 类 似 ) 

与 .这 和 .endif 配合 使 用 (与 armasm 中 的 ELSE 
类 似 ) 

标志 汇编 文件 的 结束 ， 通 常 省 略 掉 

标志 条 件 编译 代码 块 的 结束 (与 armasm 中 的 
ENDIF 类 似 ) 

标志 安定 义 的 结束 (与 armasm 中 的 MEND 类 
似 ) 

标志 循环 loop 的 结束 (与 armasm 中 的 WEND 
类 似 ) 





举例 


„ascii "Ascii text is here" 


.asciz "Zero Terminated Text" 


.balignl 16,0xdeadbeef 


.byte 25, 0x11, 031, 'A' 


.code 32 


.else 


.equ <symbol name>, <value> 设置 符号 的 值 (与 asmarm 中 的 EQU 类 似 ) .equ Version, "0.1" 


.eIT 
.exitm 


.global <symbol> 


.hword <shortl> {,<short2>} 


if <logical_expression> 
ifdef <symbol> 
.ifndef <symbol> 


include “<filename>” 


汇编 器 会 终止 

中 途 退 出 宏 定 义 (与 asmarm 中 的 MEXIT 类 似 ) 

让 符号 能 够 被 外 部 访问 (与 armasm 的 EXPORT 
类 似 ) 

插入 16 位 值 到 目标 文件 中 (与 armasm 中 的 
DCW 类 似 ) 





与 endif 配置 使 用 (与 armasm 中 的 IF 类似) 


如 果 <symbol> 定义 了 ， 就 包含 代码 块 
如 果 <symbol> 没有 定义 ， 就 包含 代码 块 


包含 指定 的 源 文 件 (与 armasm 中 的 INCLUDE 
和 C 语言 中 的 #include 类 似 ) 





.hword 2, OxFFEO 


GNU ARM 汇编 伪 指 令 描述 举例 
.macro <name> {<arg 1} 定义 带 有 NN 个 参数 的 名 为 <name> 的 汇编 宏 定 | macro SHIFTLEFT a, b 


{,<arg 2>} = {,<arg N>} 义 。 宏 定义 必须 以 .endm 结束 。 它 们 与 armasm 中 |.if\b<0 
的 MACRO、MEND 和 MEXIT 类似 ， 必 人 须 在 宏 | MOV \a, \a, ASR #-\b 


参数 之 前 使 用 “\”. .exitm 
.endif 
MOV \a, \a, LSL #\b 
.endm 
rept <number of times> 重复 代码 块 <number of times 次 ， 用 .endr 结束 
<register_name> .req 为 寄存 器 命名 。 与 armasm 中 的 RN 类 似 , 不 同 | acc .req r0 


<register_name> 点 在 于 在 右边 要 提供 一 个 名 称 ， 而 不 是 一 个 数字 
.Section <section name> 开始 一 个 新 代码 段 或 者 数据 段 。 在 GNU 
{,” <flags>” } HA, text 是 代码 段 ; .data 是 已 初始 化 的 数据 段 ;.bss 
是 未 初始 化 的 数据 段 。 这 些 段 有 默认 的 标志 。( 与 
armasm 中 的 AREA 类 似 ) 下 面 是 ELF 格式 文件 
中 的 标志 : 
<Flag> 含义 
a 代 表 人 允许 部 分 ; 
w 代表 可 写 部 分 ; 
x 代表 可 执行 部 分 
.Set <variable_ name>, 设置 变量 的 值 。( 与 armasm 中 的 SETA 类 似 ) .Set Flavor, "CHERRY" 
<variable_value> 
.Space <number_of_bytes> 预 留 给 定 字 节 空 间 ， 并 设置 为 0 或 fll_byte (与 | space 25, 0b11001100 
{,<fill_ byte>} armasm 中 的 SPACE 类 似 ) 


.word <word1> {,<word2>} 插入 32 位 值 到 目标 文件 中 (与 armasm 中 的 | word 144511, 0x11223 
e DCD 类 似 ) 


1. 汇 编 中 的 特殊 字符 和 语法 





. 代码 行 中 的 注释 符号 : @ 


. 整 行 注释 符号 : # 


BaD A: ; 


+ 直接 操作 数 前 级 : HAS 


2. 寻 址 模式 


下 面 的 rn 表示 任意 的 编号 寄存 器 。 


addr: 绝对 寻 址 模式 。 


%rn: 寄存 器 直接 访问 。 


[rn]: 寄存 器 间接 或 索引 访问 。 


[%rn,#n]: 带 偏 移 量 的 寄存 器 访问 。 


#imm: 立即 数 。 


3. 机 器 相关 的 伪 指令 


-atmi 汇编 使 用 ARM 模 式 。 

` thumb: 汇编 使 用 thumb 模 式 。 

< .code16: 汇编 使 用 thumb 模 式 。 

< .code32: 汇编 使 用 arm 模 式 。 

.force_thumb: 强制 使 用 thumb 模 式 (即使 不 支持 )。 
.thumb_func: 


- .ltorg: 


8.2 ”流水 灯 的 硬件 描述 


流水 灯 的 原理 图 如 图 8-1 和 图 8-2 所 示 。 


3V3 SYS 


IPSOUT 


Green 





图 8-1 LED 电 路 连接 图 1 





LCD1_DI15/ATADII/KP_INS/SMC_VPPPP/EINT15/CSIL_D15/PH15 | 4! TX_LED [15] 
LCD1 D16/ATAD12/KP_IN6/SMC_DET/EINT16/CSI1_D16/PH16}=! RX LED [15] 


图 8-2 LED 电 路 连接 图 2 


从 原理 图 可 以 读 出 实际 上 2 个 LED 是 由 2 个 GPIO 控 制 的 ， 它 们 的 对 应 关系 为 : TX_LED—PH15, RX_LED—PH16, 


了 解 了 它 的 硬件 描述 后 ， 就 知道 其 软件 编码 的 流程 : 首先 应 将 对 应 的 GPIO 设 置 为 OUTPUT， 然 后 每 隔 一 定 的 时 间 间 隔 依 次 将 其 中 一 个 输出 管 脚 设置 为 低 来 点 亮 
对 应 的 LED。 





配置 GPIO 功 能 的 寄存 器 是 PH 配置 寄存 器 ， 以 PH15 为 例 。 


在 PH_CFG1 中 ， 如 图 8-3 所 示 。 


PH15 SELECT 
000: Input 001: Output 


010: LCD1_D15 011: ETXD2 
100: KP_IN5 101: SMC_VPPPP 
110:EINT15 111: CSI1_D15 





图 8-3 PH_CFG1 寄 存 器 描述 
这 里 我 们 需要 将 其 配置 为 Output， 也 就 是 该 位 域 的 值 设 为 001。 
接着 配置 对 应 的 引 脚 是 否 上 拉 或 者 下 拉 ， 如 图 8-4 所 示 。 
PH PULL 
[2i+ 1:21] PH[n] Pull-up/down Select (n = 0~15) 


(i=0~15) 00: Pull-up/down disable 01: Pull-up 
10:Pull-down 11:Reserved 





图 8-4 PH_PULL 寄 存 器 描述 


最 后 是 配置 GPIO 的 输出 值 ， 如 图 8-5 所 示 。 


PH DAT 
If the port is configured as input, the corresponding bit is the pin state. If the 


port is configured as output, the pin state is the same as the corresponding 


bit. The read bit value is the value setup by software. If the port is 


configured as functional pin, the undefined value will be read. 





图 8-5 PH_DAT 寄 存 器 描述 


如 果 该 端口 配置 为 Input， 那 么 相应 的 位 为 引 脚 的 状态 ， 如 果 端 口 配 置 为 Output， 引 脚 的 状态 就 是 相应 位 的 值 ， 读 取 的 值 就 是 软件 设 定 的 值 ， 如 果 管 脚 配置 为 其 
他 功能 管 脚 ， 将 读 到 未 定义 的 值 。 所 以 将 对 应 的 bit 写 0 就 表示 输出 低 ， 就 可 以 点 亮 LED 了 。 








8.3 流水 灯 的 汇编 实现 


汇编 文件 有 两 个 ， 第 一 个 文件 为 start.sS， 作 用 为 设置 堆栈 ， 并 跳 转 到 main 函 数 ， 代 码 如 下 : 


代码 清单 8-1: 流水 灯 的 start.S 代 码 





RR RR RR RR RR RRR IRR I ROK ARK IRR ORR IKK KIA ROK I ROR IK KK IK 


@ File: start.S 
@ 功能 : 通过 它 转 入 主 程序 
(He e e I IRI I RIA IRI IRR IIR e e e e IR IIR IO IIR IR IO A e IO IO 
„text 
.global _start 
start: 
— ldr sp, =0x00007£00 
bl main 
halt loop: 
b halt loop 





第 二 个 文件 为 led.S， 里 面 是 流水 灯 的 功能 实现 ， 代 码 如 下 : 


代码 清单 8-2: 流水 灯 的 实现 led.S 代 码 





.equ PH CFG1, 0x01C20900 
.equ PH CFG3, 0x01C20904 
.equ PH PULLO, 0x01C20918 
.equ PH PULL1, 0x01C2091C 
.equ PH DAT, 0x01C2090C 

.global main 


ldr r0,=PH CFG1 

ldr r1,=0x10000000 
str rl, [r0 
ldr r0,=PH CFG2 

ldr r1,=0x00000001 
str rl, [r0 
ldr r0,=PH PULLO 


idr r1,=0%55555555 


ldr r0,=PH_PULL1 
ldr r1,=0x55555555 
0 


ledloop 
ldr r0,=PH DAT 
dr r1,=0x000£0000 
str rl, [r0 
bl delay 











ldr r0,=PH DAT 
ldr r1,=0x0000£000 
str rl, [r0 
bl delay 
b ledloop 
delay: 
ldr r3,=0xfffff 
delay1: 
sub r3, £3, #1 
cmp r3, #0x0 
bne delay1 
mov pc, lr 

















maint RSEEMAM, EGPA edoop7 RASILI, TKT PMA RET delay RSA SERTEN “一 闪 一 闪 
亮晶晶 ”了 ， 现 在 还 没有 初始 化 时 钟 ， 注 意 调 整 延 时 ， 不 然 效果 不 大 对 。 
8.4 “流水 灯 的 编译 和 链接 


流水 灯 代 码 工程 的 Makefile 如 下 : 


代码 清单 8-3: 流水 灯 工 程 的 Makefile 





CFLAGS := -Wall -Wstrict-prototypes -g -fomit-frame-pointer -ffreestanding 
all:start.S led.s 

arm-linux-gcc $(CFLAGS) -c -o start.o start.S 

arm-linux-gcc $(CFLAGS) -c -o led.o led.s 

arm-linux-ld -T led.lds start.o led.o -o led elf 

arm-linux-objcopy -O binary -S led elf led.bin 

arm-linux-objdump -D -m arm led elf > led.dis 
clean: 

rm =£ led.dis led.bin led elf *.o 








链接 脚本 如 下 : 


代码 清单 8-4: 流水 灯 工 程 的 链接 脚本 





OUTPUT_FORMAT ("el £32-littlearm", "elf32-littlearm", "elf32-littlearm") 
OUTPUT ARCH (arm) 
ENTRY ( start) 
SECTIONS 
{ 
. = 0x00000000; 
.text : { 
*(.text) 
* (,rodata) 


} 
.data ALIGN(4): { 
* (.data) 


} 
-bss ALIGN(4): { 


* (.bss) 
} 


很 简单 清晰 的 Makefile， 分 别 编译 两 个 汇编 代码 文件 ， 然 后 用 指定 的 led.lds 链 接 脚本 将 其 链接 为 elf 格 式 文件 ， 然 后 生成 bin 文 件 ， 最 后 dump 出 dis 文 件 方便 调试 
和 分 析 。 


链接 脚本 同样 十 分 简单 ， 起 始 地 址 设 为 0x00000000，“.text” 放 在 最 前 ， 后 面 跟着 放置 “.data” 和 “.bss”。 


这 是 个 最 简单 的 入 门 代码 一 一 流水 灯 ， 使 用 ADS、CodeWarriorlDE 等 工具 开发 是 相当 简单 的 ， 而 在 Linux 下 使 用 Vi 编写 代码 ， 使 用 arm-linux-gcc 交 叉 编译 器 进 
行 链接 ， 这 个 过 程 不 仅 要 熟悉 Linux 开 发 环境 、ARM 体 系 结构 和 汇编 指令 等 ， 还 需要 对 编译 链接 和 链接 脚本 做 一 定 深度 的 理解 。 综 合 这 些 内 容 是 为 了 本 书 最 后 对 
BootLoader 的 讲解 和 U-Boot 的 分 析 做 铺垫 。 





8.5 本章 小 结 


本 章 为 读者 展示 了 一 个 知行 合 一 的 样 例 。 古 语 说 的 好 “ 纸 上 得 来 终 觉 浅 ， 绝 知 此 事 要 身 行 ”。 因 此 请 读者 细 细 揣摩 ， 多 加 实践 ， 深 入 理解 全 面 各 个 章节 的 知识 
点 ， 为 最 后 两 章 做 充分 准备 。 


第 9 章 ”U-Boot 代 码 的 分 析 


本 章 导读 
U-Boot 作 为 一 款 流行 的 功能 强大 的 开源 BootLoader 项 目 ， 非 常 值得 我 们 细 细 研读 和 学 习 。 通 过 它 可 以 完整 全 面 地 了 解 BootLoader 是 如 何 一 步 步 引导 操作 系统 的 。 
9.1 节 为 U-Boot 简 介 ， 介 绍 其 发 展 历史 和 功能 特性 。 
9.2 节 介绍 U-Boot 的 目录 结构 ， 以 对 U-Boot 的 代码 结构 有 更 进一步 的 认识 。 
9.3 节 讲解 如 何 配置 和 编译 U-Boot。 


9.4 节 对 U-Boot 中 的 SPL 框 架 和 U-Boot 代 码 进行 分 析 说 明 。 


9.1 U-Boot 简 介 


U-Boot 的 全 称 为 Universal Boot Loader， 是 遵循 GPL 条 款 的 开放 源码 项 目 ， 从 FADSROM、8xxROM、PPCBOOT 逐 步 发 展演 化 而 来 ， 其 源码 目录 、 编 译 形式 
与 Linux 内 核 很 相似 。 事 实 上 ， 不 少 U-Boot 源 码 就 是 相应 的 Linux 内 核 源 程序 的 简化 ， 尤 其 是 一 些 设备 的 驱动 程序 ， 从 U-Boot 源 码 的 注释 中 能 体会 到 这 一 点 。 但 是 U- 
Boot 不 仅仅 支持 嵌入 式 Linux 系 统 的 引导 ， 当 前 ， 它 还 支持 OpenBSD、NetBSD、FreeBSD、4.4BSD、Linux、SVR4、Esix、Solaris、lrix、SCO、Dell、NCR、 
VxWorks、LynxOS、pSOS、QNX、RTEMS、ARTOS 等 操作 系统 。 这 是 U-Boot 中 Universal 的 一 层 仿 义 ， 另 外 一 层 含义 则 是 U-Boot 除 了 支持 PowerPC 系 列 的 处 理 
器 外 ， 还 能 支持 MIPS、x86、ARM、NIOS、XScale 等 诸多 常用 系列 的 处 理 器 。 这 两 个 特点 正 是 U-Boot 项 目的 开发 目标 ， 即 支持 尽 可 能 多 的 嵌入 式 处 理 器 和 嵌入 式 
操作 系统 。 就 目前 来 看 ，U-Boot 对 PowerPC 系 列 处 理 器 的 支持 最 为 丰富 ， 对 Linux 的 支持 最 完善 。 其 他 系列 的 处 理 器 和 操作 系统 基本 是 在 2002 年 11 月 PPCBOOT 改 
名 为 U-Boot 后 逐步 扩充 的 。 从 PPCBOOT 向 U-Boot 的 顺利 过 渡 ， 很 大 程度 上 归功 于 U-Boot 的 维护 人 一 一 德国 DENX 软 件 工 程 中 心 Wolfgang Denk (以 下 简称 
W.D) 精湛 的 专业 水 平和 坚持 不 懈 的 努力 。 当 前 ，U-Boot 项 目 正在 他 的 领军 之 下 ， 众 多 有 志 于 开放 源码 BootLoader 移 植 工作 的 嵌入 式 开 发 人 员 正 如 火 如 茶 地 开展 着 
各 个 不 同系 列 嵌 入 式 处 理 器 的 移植 工作 ， 以 支持 更 多 的 嵌入 式 操作 系统 的 装载 与 引导 。 


除了 U-Boot， 还 有 些 比较 流行 的 BootLoader， 比 如 LILO、GRUB、Blob、vivi 等 。 

下 面 列 出 选择 U-Boot 的 理由 : 

1) 开放 源码 ; 

2) 支持 多 种 嵌入 式 操作 系统 内 核 ， 如 Linux、NetBSD、VxWorks、QNX、RTEMS、ARTOS、LynxOs; 
3) 支持 多 个 处 理 器 系列 ， 如 PowerPC、ARM、x86、MIPS、XScale; 

4) 较 高 的 可 靠 性 和 稳定 性 ; 

5) 高 度 灵活 的 功能 设置 ， 适 合 U-Boot 调 试 、 操 作 系统 的 不 同 引导 要 求 和 产品 发 布 等 ; 

6) 丰富 的 设备 驱动 源码 ， 如 串口 、 以 太 网 、SDRAM、Flash、LCD、NVRAM、EEPROM、RTC 和 键盘 等 ; 


7) 较为 丰富 的 开发 调试 文档 与 强大 的 网 络 技术 支持 。 





9.2 U-BoothR4i4 


U-Boot 的 目录 大 致 分 为 三 类 。 





第 一 类 目录 与 处 理 器 体系 结构 或 者 开发 板 硬件 直接 相关 。 
arch: 和 体系 结构 相关 的 代码 ， 比 如 大 家 熟知 的 arm、avr32、mips、opentisc、powerpc 和 x86。 
‘board: 目标 板 相关 文件 ， 主 要 包含 一 些 内 存 驱 动 。 
‘include: U-Boot 头 文件 ， 尤 其 configs 子 目录 下 与 目标 板 相关 的 配置 头 文件 是 移植 过 程 中 经 常 要 修改 的 文件 。 


第 二 类 目录 是 一 些 通用 的 函数 或 者 驱动 程序 。 





common: 独立 于 处 理 器 体系 结构 的 通用 代码 ， 如 内 存 大 小 探测 与 故障 检测 。 
- driver: 通用 设备 驱动 ， 如 CFI FLASH 了 驱动 (目前 对 INTEL FLASH 支 持 较 好 ) 。 
“fs: 包含 文件 系统 的 代码 。 
‘lib: 与 处 理 器 体系 无 关 的 库 文件 ， 如 md5、CRC 等 算法 的 实现 。 
“net: 与 网 络 功能 相关 的 文件 目录 ， 有 简单 4 层 网 络 协 议 栈 的 实现 ， 如 atp、bootp、nfs 和 tftp 等 。 
‘post: 上 电 自 检 文件 目录 ， 尚 有 待 于 进一步 完善 。 
第 三 类 目录 是 U-Boot 的 应 用 程序 、 工 具 、 测 试 程 序 或 者 文档 。 
" api: API 接 口 ， 为 其 他 应 用 提供 的 与 机 器 类 型 、 体 系 结构 无 关 的 API。 
“ doc: U-Boot 的 说 明文 档 。 
< examples: 可 在 U-Boot 下 运行 的 示例 程序 ， 如 hello_world.c 和 timer.c。 
test: 测试 脚本 和 代码 。 
- tools: 用 于 创建 U-Boot S-RECORD 和 BIN 镜像 文件 的 工具 。 
因为 U-Boot 是 一 个 完整 成 熟 的 嵌入 式 BootLoader 框 架 ， 我 们 更 多 的 是 进行 配置 和 移植 工作 ， 所 以 主要 来 分 析 一 下 第 一 类 目录 。 


(1) arch 目 录 











该 目录 有 很 多 子 目录 ， 都 是 按照 体系 结构 进行 划分 的 ， 比 如 arm、avr32、m68k、mips、openrisc、powerpc、x86 这 些 常见 的 体系 架构 。 因 为 本 书 以 ARM 体 
系 为 基础 ， 所 以 我 们 分 析 arm 目 录 下 的 结构 ， 对 于 arm 有 目录， 我 们 主要 分 析 cpu 目 录 和 lib 目 录 。cpu 目 录 根 据 arm 的 版 本 号 进行 划分 ， 如 arm11、arm720t、armv7 
等 。 例 如 在 armv7 版 本 的 目录 下 ， 又 有 一 些 通 用 的 代码 和 与 处 理 器 相关 的 代码 ， 其 中 与 处 理 器 相关 的 代码 会 放 在 对 应 的 子 目录 下 面 。lib 目 录 则 放置 arm 体 系 结构 下 通 
用 的 汇编 代码 和 C 代 码 ， 比 如 处 理 协 处 理 器 的 cache-cp15.c， 处 理 中 断 的 interrupts.c， 处 理 重 定位 的 relocate.S 等 。 


(2) board 目 录 
里 面 放置 各 种 目标 板 的 相关 代码 。 比 如 sunxi 目 录 下 有 板 级 dram 的 初始 化 代码 等 。 
(3) include 目 录 
里 面 放 置 了 公用 的 头 文件 ， 其 中 configs 子 目录 下 放置 有 与 目标 板 相关 的 头 文件 。 比 如 sun7i.h 和 sunxi-common.h， 里 面包 含 着 许多 与 板 级 配置 相关 的 宏 定义 。 


最 后 ， 我 们 介绍 一 下 examples 目 录 。 因 为 在 所 有 的 开源 代码 中 ， 一 般 都 会 有 一 个 examples 目 录 ， 其 下 放置 一 些 简单 的 实例 ， 相 当 于 一 个 入 门 向 导 ， 帮 助 我 们 更 
好 地 理解 这 个 开源 项 目 。 学 习 软 件 开发 的 时 候 ， 我 们 经 常用 hello world 作 为 示例 ，U-Boot 也 写 了 一 个 hello world 作 为 示例 ， 该 示例 相当 于 一 个 独立 的 程序 ， 是 由 
BootLoader 引 导 执 行 的 。 有 兴趣 的 读者 可 以 试 着 运行 一 下 这 个 hello world， 读 者 也 可 以 在 网 上 阅读 一 下 黄 敬 群 的 《深入 浅 出 Hello World》， 相 信 你 对 hello world 
会 有 不 一 样 的 理解 ， 对 BootLoader、 计 算 机 系统 也 会 有 更 深入 的 理解 。 


9.3 U-Boot 配 置 和 编译 


在 大 概 了 解 U-Boot 及 其 目录 结构 后 ， 就 可 以 开始 配置 和 编译 U-Boot 了 。 

在 U-Boot 源 码 中 有 一 个 README 文 件 ， 它 描述 了 如 何 配置 并 编译 U-Boot。 

正确 编译 U-Boot 代 码 的 过 程 如 下 : 

1) 首先 是 编译 器 的 问题 ， 如 果 使 用 GNU 交 叉 编 译 工具 链 ， 请 确保 环境 变量 的 设置 生效 。 


2) 为 特定 的 板子 建立 配置 文件 。 输 入 make NAME_config 就 可 以 ， 其 中 “NAME_config” 代 表 一 个 存在 的 配置 名 称 ， 顶 层 目 录 下 的 boards.cfg 文 件 中 是 已 经 
支持 的 配置 名 称 。 


3) 最 后 ， 输 入 “make all” 就 可 以 得 到 U-Boot 映 像 文件 了 。 其 中 “u-boot.bin” 是 二 进 制 文 件 ，“U-Boot” 是 ELF 二 进 制 格式 的 文件 。 
在 这 个 过 程 中 各 步骤 的 详细 操作 如 下 。 
第 一 步 操作 在 前 面 章节 中 已 经 介绍 过 ， 下 面 介绍 第 二 步 和 第 三 步 。 


第 二 步 : 为 特定 的 硬件 板 pcDuino3 建 立 配置 文件 ， 打 开 boards.cfg 文 件 ， 添 加 一 行 配置 信息 : 


Active arm armv7 sunxi - Sunxi 
pcDuino3 sun7i:PCDUINO, SPL, SUNXI_EMAC 


然后 输入 make pcDuino3_config 命 令 ， 执 行 第 二 步 的 命令 ， 接 下 来 分 析 这 个 命令 做 了 什么 : 


2 


%_config:: outputmakefile 
Q$ (MKCONFIG) -A $(@: config=) 





由 于 % 是 个 通配符 ， 所 以 无 论 是 何 种 配置 ，make xxx_config 都 是 这 个 目标 。 命 令 中 的 MKCONFIG 在 Makefile 之 前 有 如 下 定义 : 








MKCONFIG := $(SRCTREE) /mkconfig 
export MKCONFIG 





该 定义 表明 MKCONFIG 是 顶层 目录 下 的 mkconfig 脚 本 文件 。 


我 们 继续 来 看 完整 的 命令 : @$MKCONFIG)-A$(@:_config=)， 这 里 $(@:_config=) 是 变量 的 替换 引用 。 其 具体 使 用 方法 为 : 格式 为 “$(VAR:A=B)” 或 
者 “$fVAR:A=B})”， 意 思 是 : 替换 变量 “VAR” 中 所 有 以 “A” 字 符 结尾 的 字 为 “B” 结 尾 的 字 。 这 将 相当 于 把 pcDuino3_config 示 尾 的 _config 去 除了 。 因 此 实际 执 


行 的 是 “mkconfig-A pcDuino3” 命 令 。 











执行 该 脚本 将 生成 两 个 文件 ， 这 两 个 文件 将 在 后 面 的 步骤 中 被 引用 。 其 中 一 个 是 include/config.h， 如 下 : 





下 面 就 是 执行 mkconfig 脚 本 了 : 
mkconfig -A pcDuino3 
执行 该 脚本 ， 生 成 两 个 文件 ， 一 个 是 include/config.h， 如 下 : 


代码 清单 9-1: 生成 文件 config.h 


/* Automatically generated - do not edit */ 
define CONFIG PCDUINO 1 
#tdefine CONFIG SPL 1 

define CONFIG SUNXI EMAC ak 
define CONFIG SYS ARCH "arm" 
#define CONFIG SYS CPU "armv7" 
define CONFIG SYS BOARD "sunxi" 
#define CONFIG SYS TARGET "pcDuino3" 
define CONFIG SYS SOC "sunxi" 
#define CONFIG BOARDDIR board/sunxi 
include <config_cmd defaults.h> 
#include <config defaults.h> 
#include <configs/sun7i.h> 

#include <asm/config.h> 

include <config_fallbacks.h> 
#include <config_uncmd_spl.h> 








还 有 一 个 文件 是 include/config.mk， 如 下 : 


代码 清单 9-2: 生成 文件 config.mk 


ARCH = arm 
CPU = armv7 
BOARD = sunxi 


件 


o 


下 一 步 就 是 make。 因 为 在 boards.cfg 文 件 中 有 配置 sun7i:PCDUINO、SPL、SUNXI_EMAC， 所 以 这 里 我 们 将 使 用 SPL 框 架 。 在 spl 目 录 下 ， 有 一 个 Makefile 文 
我 们 简单 分 析 一 下 这 个 Makefile 文 件 。 


首先 : 


CONFIG SPL BUILD := y 
export CONFIG SPL BUILD 





定义 并 导出 CONFIG_SPL BUILD， 这 个 定义 是 SPL 框 架 最 重要 的 定义 ， 在 最 初 的 汇编 代码 中 很 多 代码 段 都 由 该 定义 隔 开 。 


include include/config.mk 
include $ (TOPDIR) /config.mk 


引入 刚刚 生成 的 include/config.mk 和 顶层 目录 下 的 config.mk， 其 中 顶层 目录 下 的 config.mk 是 设置 了 一 些 编译 链接 的 选项 。 
接 下 来 是 SPL 需 要 的 代码 和 模块 。 

再 往 下 是 指定 链接 脚本 。 

代码 清单 9-3: Makefile 中 指定 链接 脚本 的 片段 


# Linker Script 

ifdef CONFIG SPL LDSCRIPT 

# need to strip off double quotes 

LDSCRIPT := $(addprefix $(SRCTREE)/,$(CONFIG SPL LDSCRIPT:"%"=3) ) 
endif Pp 
ifeq ($(wildcard $ (LDSCRIPT)),) 

LDSCRIPT := $(TOPDIR) /board/$ (BOARDDIR) /u-boot-spl.lds 
endif 
ifeq ($(wildcard $(LDSCRIPT) ),) 

LDSCRIPT := $(TOPDIR) /$ (CPUDIR) /u-boot-spl.lds 
endif 
ifeq ($(wildcard $ (LDSCRIPT)),) 

LDSCRIPT := $(TOPDIR) /arch/$ (ARCH) /cpu/u-boot-spl.lds 
Endif 
ifeq ($(wildcard $(LDSCRIPT) ),) 
$(error could not find linker script) 
endif 














再 下 面 是 描述 最 终 的 目标 : 


代码 清单 9-4: Makefile 中 描述 最 终 目 标的 片段 


ALL-y += $(0bj)/$ (SPL BIN) .bin 
ifdef CONFIG SUNXI 

ifndef CONFIG SPL FEL 

+= $(obj) /sunxi-spl.bin 





> 
E 

T 
K 


所 以 最 后 在 该 目录 下 会 生成 u-boot-spl.bin 和 sunxi-spl.bin， 其 中 sunxi-spl.bin 是 使 用 mksunxiboot 工 具 生 成 的 : 


代码 清单 9-5: Makefile 中 描述 mksunxiboot 的 片段 


ifdef CONFIG SUNXI 
quiet_cmd_mksunxiboot = MKSUNXI $@ 
cmd_mksunxiboot = $(OBJTREE) /tools/mksunxiboot $< $@ 
$ (obj) /sunxi-spl.bin: $ (obj) /$(SPL_BIN) .bin 
$(call if changed,mksunxiboot) 
Endif 可 


接 下 来 分 析 一 下 链接 脚本 。 
根据 前 面 关于 链接 脚本 的 一 系列 判断 和 指定 ， 此 处 的 链接 脚本 采用 的 是 arch/arm/cpu/armv7/sunxi/u-boot-spl.lds， 脚 本 如 下 : 


代码 清单 9-6: SPL 框 架 下 的 链接 脚本 


MEMORY { .sram : ORIGIN = CONFIG SPL TEXT BASE, \ 
LENGTH = CONFIG SPL MAX SIZE } 
MEMORY { .sdram : ORIGIN = CONFIG SPL BSS START ADDR, \ 
LENGTH = CONFIG SPL BSS MAX SIZE } E 
OUTPUT FORMAT ("elf32-littlearm", "elf32-littlearm", "elf32-littlearm") 
OUTPUT ARCH (arm) 
ENTRY ( start) 
SECTIONS 
{ 
¿text 
{ 


_ start = .; 


arch/arm/cpu/armv7/start.o (.text) 
*(.text*) 
p > .sram 
. = ALIGN(4); 
-rodata : { *(SORT BY ALIGNMENT (.rodata*)) } >.sram 
. = ALIGN(4); ake 
.data : { *(SORT BY ALIGNMENT (.data*)) } >.sram 
. = ALIGN(4); 一- 
image copy end = .; 
“end=.; T 
bss : 




















在 脚本 最 开始 处 ， 使 用 MEMORY 命 令 定义 了 两 个 存储 区 域 : 一 个 是 sram， 起 始 地址 为 CONFIG_SPL TEXT_BASE， 长 度 为 CONFIG SPL MAX SIZE; 另 一 个 是 
sdram， 起 始 地 址 为 CONFIG_SPL BSS_START_ADDR,， 长 度 为 CONFIG_ SPL BSS _MAX SIZE。 这 几 个 定义 都 是 在 include/configs/sunxi-common.h 中 : 


代码 清单 9-7: sunxi-common.h 中 存储 区 域 地 址 的 定义 


#define CONFIG SPL TEXT BASE 0x20 


#define CONFIG SPL TEXT BASE 0x5fe0 
#define CONFIG SPL BSS_START_ADDR 0x50000000 
#define CONFIG SPL BSS_MAX SIZE 0x80000 


这 里 可 以 看 到 TEXT 段 的 基 址 定 为 0x20， 这 是 因为 mksunxiboot 的 存在 ， 它 会 加 上 大 小 为 0x20 的 特定 的 头 。 
在 SECTIONS 命 令 中 定义 了 .text、.rodata、.data 和 .bss 这 四 个 段 。 
其 中 .text、.rodata 和 .data 段 放 在 sram 内 存 区 域 中 ， 而 .bss 段 放 在 sdram 内 存 区 域 中 。 


在 .text 段 中 ， 我 们 将 arch/arm/cpu/armv7/start.o 中 的 .text 段 放置 在 最 前 面 ， 其 他 对 象 文件 的 .text 段 随后 放置 。 在 .rodata 段 和 .data 段 中 ， 使 用 
SORT_BY_ALIGNMENT 将 各 个 对 象 文件 的 相应 段 对 齐 排序 。 





在 分 析 完 SPL 的 Makefile 和 Idscript 后 ， 我 们 需要 对 SPL 框 架 做 一 个 更 全 面 的 了 解 ， 从 而 理解 U-Boot 加 入 SPL 框 架 的 考虑 。 


为 了 可 以 使 已 有 的 所 有 SPL 的 设计 统一 ， 也 为 了 简化 添加 适用 于 新 板子 的 设计 ， 专 门 设计 一 个 通用 的 SPL 框 架 。 在 SPL 框 架 下 ， 一 个 板子 的 所 有 代码 都 能 够 被 重 
用 。 代 码 复制 和 链接 不 再 是 必要 的 。 








有 一 个 新 目录 TOPDIR/spl， 它 包含 一 个 Makefile。SPL 编 译 的 对 象 文件 是 单独 在 此 目录 下 编译 存放 的 。 最 终生 成 的 二 进 制 文件 包括 u-boot-spl、u-boot-spl.bin 
和 u-boot-spl.map。 


在 SPL 编 译 过 程 中 ，make 环 境 中 会 使 用 CONFIG_SPL BUILD， 并 且 在 CPPFLAGS 选 项 上 加 上 -DCONFIG_SPL BUILD。 这 样 源 文件 使 用 不 同 的 配置 编译 为 SPL。 
基于 ARM 的 板子 曾经 使 用 CONFIG_PRELOADER 选 项 。 例 如 : 


ifeq ($ (CONFIG SPL BUILD),y) 
COBJS-y += board_spl.o 
else 
COBJS-y += board.o 
endif 
COBJS-$ (CONFIG SPL BUILD) += foo.o 
#ifdef CONFIG SPL BUILD 
foo(); 
#endif 


SPL 镜 像 的 编译 可 以 使 用 “# define CONFIG_SPL”， 因 为 SPL 镜 像 通常 是 不 同 的 代码 段 基 址 ， 它 必须 由 CONFIG_SPL TEXT_BASE 宏 定义 配置 。 





链接 脚本 由 CONFIG_SPL LDSCRIPT 宏 定义 配置 。 


为 了 在 SPL 中 支持 通用 的 U-Boot 库 和 驱动 ， 我 们 可 以 选择 性 地 定义 CONFIG_SPL XXX_SUPPORT。 











目前 支持 下 面 的 选项 : 

CONFIG SPL LIBCOMMON SUPPORT (common/1ibcommon.o) 

CONFIG SPL LIBDISK SUPPORT (disk/libdisk.o) 

CONFIG SPL I2C SUPPORT (drivers/i2c/libi2c.0) 

CONFIG SPL GPIO SUPPORT (drivers/gpio/libgpio.o) 

CONFIG SPL MMC SUPPORT (drivers/mmc/libmmc.o) 

CONFIG SPL SERIAL SUPPORT (drivers/serial/libserial.o) 
CONFIG SPL SPI FLASH SUPPORT (drivers/mtd/spi/libspi_flash.o) 
CONFIG SPL SPI SUPPORT (drivers/spi/libspi.o) 7 
CONFIG SPL FAT SUPPORT (fs/fat/libfat.o) 

CONFIG SPL LIBGENERIC SUPPORT (lib/libgeneric.o) 

CONFIG SPL POWER SUPPORT (drivers/power/libpower.o) 
CONFIG SPL NAND SUPPORT (drivers/mtd/nand/libnand.o) 
CONFIG SPL DRIVERS MISC SUPPORT (drivers/misc) 

CONFIG SPL DMA SUPPORT (drivers/dma/libdma.o) 

CONFIG SPL POST MEM SUPPORT (post/drivers/memory.o) 

















CONFIG SPL NAND LOAD (drivers/mtd/nand/nand_spl_load.o) 
CONFIG SPL SPI LOAD (drivers/mtd/spi/spi_spl_load.o) 
CONFIG SPL RAM DEVICE (common/spl/spl.c) 

CONFIG SPL WATCHDOG SUPPORT (drivers/watchdog/libwatchdog.o) 





看 到 这 里 ， 我 们 了 解 了 U-Boot 加 入 SPL 框 架 是 为 了 统一 SPL 的 设计 ， 那 么 最 初 为 什么 有 SPL 的 设计 呢 ? 








我 们 得 从 闪存 技术 开始 聊 起 ， 闪 存 技术 是 现在 市 场 上 最 主要 的 非 易 失 性 存储 技术 之 一 。Intel 于 1988 年 首先 开发 出 NOR Flash 技 术 ， 彻 底 改 变 了 原先 由 EPROM 和 
EEPROM 一 统 天 下 的 局 面 。 紧 接着 在 1989 年 ， 东 芝 公 司 发 表 了 NAND Flash 结 构 ， 强 调 降低 每 比特 的 成 本 和 更 高 的 性 能 ， 并 且 像 磁盘 一 样 可 以 通过 接口 轻松 升级 。 
NOR Flash 的 特点 是 带 有 SRAM 接 口 ， 有 足够 的 地 址 引 脚 来 寻 址 ， 可 以 很 容易 地 存 取 其 内 部 的 每 一 个 字 节 ， 因 此 支持 芯片 内 执行 (Execute In Place, XIP) ， 这 样 应 
用 程序 可 以 直接 在 Flash 闪 存 内 运行 ， 不 必 再 把 代码 读 到 系统 RAM 中 。NOR Flash 的 传输 效率 很 高 ， 在 1~4MB 的 小 容量 时 具有 很 高 的 成 本 效益 ， 但 是 很 低 的 写 入 和 擦 
除 速 度 大 大 影响 了 它 的 性 能 。 而 NAND Flash 结 构 能 提供 极 高 的 单元 密度 ， 可 以 达到 高 存储 密度 ， 并 且 写 入 和 擦 除 的 速度 也 很 快 。 应 用 NAND Flash 的 困难 在 于 其 管 
理 需 要 特殊 的 系统 接口 ， 因 此 NAND Flash 并 不 支持 XIP。 在 早期 的 设计 中 ， 经 常 有 NOR Flash 和 NAND Flash 混 合 使 用 的 例子 ， 最 初 的 BootLoader 存 放 在 NOR 
Flash 中 ， 而 后 续 的 应 用 程序 (比如 内 核 和 文件 系统 ) 放 在 高 存储 密度 的 NAND Flash 中 。 

















如 果 嵌 入 式 系 统 仅 仅 使 用 NAND Flash， 不 再 使 用 NOR Flash， 也 是 有 解决 方法 的 ， 即 使 用 芯片 内 的 ROM 或 者 其 他 机 制 加 载 固件 到 SRAM 中 。 比 如 Samsung 的 
s3c24xx 系 列 和 Allwinner 的 A20。s3c24xx 有 一 块 内 部 的 4KB 大 小 的 SRAM ， 当 采用 NAND Flash 方 式 启动 时 ， 独 有 的 硬件 机 制 会 将 位 于 NAND Flash 最 前 4KB 的 数据 
自动 加 载 到 这 块 SRAM 中 ， 在 这 4KB 的 代码 中 完成 NAND Flash 接 口 的 初始 化 ， 就 可 以 实现 从 NAND Flash 完 成 系统 的 启动 了 。 而 A20 的 NAND Flash 采 用 另 一 种 方 
xt, 使 用 内 部 的 ROM。 当 A20 从 NAND Flash 启 动 时 ,会 显示 内 部 ROM 中 代码 输出 的 打印 信息 。 


这 种 时 候 就 需要 SPL， 因 为 SPL 短 小 精 悍 ， 适 用 于 4KB 甚 至 更 小 的 SRAM 的 环境 。 这 时 候 的 引导 过 程 就 变 成 : 第 一 步 由 SPL 引 导 U-Boot， 第 二 步 由 U-Boot 再 引导 
系统 内 核 。 


在 U-Boot 源 码 的 顶层 目录 下 ， 有 nand _spl 目 录 和 spl 目 录 。 如 果 对 Samsung 的 sS3c24xx 和 s3c64xx 平 台 有 一 定 了 解 的 话 ， 就 明白 使 用 nand_spl 框 架 可 以 编译 出 基 
于 NAND Flash 启 动 的 U-Boot。 


而 这 里 我 们 的 A20 使 用 最 新 的 SPL 框 架 。SPL 框 架 是 更 加 全 面 统一 的 框架 。 使 用 该 框架 ,我 们 编译 出 u-boot-spl.bin 和 u-boot.bin。 然 后 使 用 mksunxiboot 工 具 将 
U-boot-spl.bin 转 换 为 sunxi-boot.bin， 最 后 使 用 cat 命 令 将 sunxi-boot.bin 和 u-boot.bin 拼 接 为 u-boot-sunxi-with-spl.bin。 








9.4 ”U-Boot 代 码 分 析 


在 进行 具体 的 分 析 之 前 ， 我 们 给 出 一 张 U-Boot 和 硬件 布局 和 启动 跳 转 的 流程 图 ， 从 图 9-1 中 我 们 看 到 SPL 和 U-Boot 的 存储 实际 是 分 开 的 ， 整 个 引导 流程 也 是 SPL 引 
导 U-Boot， 然 后 U-Boot 再 引导 内 核 。U-Boot 的 整体 框图 如 图 9-1 所 示 。 
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图 9-1 U-Boot 44546 


9.5 ”本 章 小结 


本 章 详细 地 分 析 了 SPL 代 码 ， 也 详细 地 分 析 了 U-Boot 代 码 中 核心 的 汇编 代码 ， 读 者 可 以 按照 这 个 思路 加 深 源码 分 析 ， 甚 至 完成 代码 移植 或 者 修改 ， 充 分 利用 U- 
Boot 这 个 很 好 的 素材 进一步 全 面 地 加 深 对 之 前 各 个 理论 知识 点 的 理解 。 


第 10 章 ”实现 简单 的 BootLoader 


本 章 导读 


本 章 我 们 首先 设计 一 个 MCU 下 的 BootLoader， 它 具有 引导 应 用 程序 和 升级 应 用 程序 的 功能 。 接 着 从 实现 一 个 简单 的 广义 的 BootLoader 开 始 ， 了 和 解 Boot 具 体 负责 嚼 
些 工 作 ，Loader 又 是 怎么 一 回 事 。 然 后 针对 Linux 对 于 Booting 的 要 求 ， 一 步 步 实 现 一 个 可 以 引导 Linux 内 核 的 BootLoader。 其 实 ， 广 义 的 BootLoader 和 引导 Linux 
BootLoader 的 Boot 部 分 都 是 极为 相似 的 ， 最 大 的 区 别 在 于 Loader 部 分 


10.1 节 实现 STM32 下 的 可 引导 、 可 升级 应 用 程序 的 BootLoader。 
10.2 节 对 将 要 实现 BootLoader 的 硬件 平台 pcDuino 进 行 描 述 。 
10.3 节 通过 介绍 三 种 不 同 的 实现 代码 复制 和 跳 转 的 方式 ， 来 对 加 载 动作 加 深 理解 。 


10.4 节 实现 引导 Linux 的 BootLoader。 


10.1 STM32 下 的 BootLoader 设 计 


通常 在 使 用 MCU 进 行 开发 设计 的 电子 产品 中 ， 只 存在 固件 的 概念 ， 并 没有 所 谓 的 BootLoader。 其 实在 此 类 设备 中 ， 同 样 是 可 以 存在 BootLoader 的 。 正 因为 有 
BootLoader， 所 以 不 需要 拆 机 就 能 对 产品 进行 固件 升级 。 万 一 产品 固件 有 缺陷 ， 那 么 利用 BootLoader 进 行 升级 非常 方便 ， 非 常 节省 精力 和 成 本 ， 因 此 越 来 越 多 的 基 
于 MCU 的 产品 也 开始 使 用 BootLoader。 


要 实现 这 种 设计 会 用 到 IAP 技 术 。IAP 是 In Application Programming (在 应 用 中 编程 ) 。 一 般 情 况 下 芯片 的 代码 区 只 有 一 个 用 户 程序 。 而 在 IAP 方 案 下 将 代码 
区 划分 为 两 部 分 ， 各 存放 一 个 程序 ， 一 个 为 BootLoader (引导 加 载 程序 ) ， 另 一 个 为 user application (用 户 应 用 程序 ) 。BootLoader 在 产品 出 厂 时 就 固定 下 来 
了 ， 当 需要 变更 user application 时 ， 只 需要 通过 触发 BootLoader 对 user application 的 擦 除 和 重新 写 入 ， 就 可 完成 对 用 户 应 用 程序 的 升级 。 图 10-1 所 示 为 MCU 下 的 
代码 布局 图 。 
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代码 区 
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图 10-1 MCU 下 的 BootLoader 代 码 布 局 图 





这 里 描述 的 是 在 STM32 系 列 微 处 理 器 中 创建 一 个 IAP 应 用 的 通用 过 程 。STM32 微 处 理 器 能 够 运行 用 户 定义 的 固件 来 执行 IAP 操 作 。 基 于 这 个 特性 ， 可 以 使 用 产品 
支持 的 任何 通信 接口 。 比 如 串口 、USB 口 、SD 卡 等 。 这 里 使 用 的 是 USART， 并 使 用 Ymodem 通 信 协 议 。 


实现 的 机 制 如 下 。 


当 复 位 发 生 时 ， 开 始 执 行 BootLoader。BootLoader 会 检测 一 个 特定 的 条 件 ， 比 如 说 按 下 组 合 键 。 当 条 件 触发 时 ，BootLoader 会 进行 一 个 分 支 判断 ， 以 更 新 用 


户 应 用 程序 或 者 直接 执行 用 户 应 用 程序 。 


用 户 应 用 程序 需要 和 BootLoader 分 开 。 最 常见 的 做 法 是 将 BootLoader 放 置 在 存储 Flash 中 的 最 开始 处 ， 并 将 用 户 应 用 程序 放置 在 其 后 的 可 用 的 存储 Flash 中 ; 这 
样 就 可 以 独立 配置 两 块 区 域 的 内 存 保护 。 这 里 使 用 USART 而 不 是 其 他 更 复杂 的 通信 接口 ， 这 样 就 会 极 大 地 减少 存储 的 使 用 。 这 里 使 用 的 代码 X-CUBE-IAP-USART 可 
以 在 www.st.com 官 网 进行 下 载 。 


我 们 以 STM3210C_EVAL 评 估 板 为 例 ， 其 代码 结构 如 图 10-2 所 示 。 
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图 10-2 STM32 代 码 结构 图 


Drivers 目 录 是 STM32 底 层 的 驱动 ， 都 是 官方 的 库 文件 。example 目 录 分 为 EWARM 和 User 目 录 。EWARM 中 的 是 启动 汇编 代码 ;而 User 目 录 中 的 就 是 实现 IAP 升 
级 的 核心 。 


User 目 录 下 的 代码 如 下 。 
- main.c: 进行 USART 的 初始 化 和 RCC 的 配置 ， 然 后 执行 menu.c 中 的 主 菜单 。 
menu.c; 主 菜单 的 实现 。 主 菜单 有 以 下 选项 : 下 载 新 的 二 进 制 文件 ， 上 传 内 部 Flash 存 储 的 内 容 ， 执 行 加 载 的 二 进 制 文件 ， 管 理 Flash 的 写 保护 功能 。 
-flash_ifc: 它 实现 了 内 部 Flash 的 擦 除 和 读 写 功能 。 
-common.c: 它 包 含 与 USART 接 口 相关 的 读 写 功能 。 
“ ymodem.c: 它 使 用 Ymodem 协 议 来 进行 终端 应 用 进行 数据 的 收发 。 


在 分 析 代 码 流程 之 前 ， 我 们 先 看 一 下 STM32 的 Flash 空 间 布局 ， 如 图 10-3 所 示 。 


底 层 Flash 仓储 地 址 /------------------------------------------- \0x0803FFFF 


8 一 127 页 
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图 10-3 STM32 的 Flash 空 间 布局 


我 们 可 以 清楚 地 看 到 BootLoader (也 就 是 图 10-3 中 的 IAP 代 码 ) 从 0x08000000 开 始 ， 而 应 用 程序 从 0x08004000 开 始 ， 也 就 是 说 为 BootLoader 预 留 了 16KB 的 大 


小 。 


代码 清单 10-1: IAP 代 码 中 的 main.c 代 码 





int main (void) 
{ 
/* STM32F107xC HAL library initialization: 
- Configure the Flash prefetch 
- Systick timer is configured by default as source of time base, but user 
can eventually implement his proper time base source (a general purpose 
timer for example or other time source), keeping in mind that Time base 
duration should be kept lms since PPP_TIMEOUT_VALUEs are defined and 
handled in milliseconds basis. 
- Set NVIC Group Priority to 4 
- Low Level Initialization 
ay 
HAL Init(); 
/* Configure the system clock to 72 MHz */ 
SystemClock_Config(); 
/* Initialize Key Button mounted on STM3210C-EVAL RevC board */ 
BSP_PB Init (BUTTON KEY, BUTTON MODE GPIO); 
/* Test if Key push-button on STM3210C-EVAL RevC Board is pressed */ 
if (BSP PB GetState (BUTTON KEY) == GPIO PIN RESET) 
{ 
/* Initialise Flash */ 
FLASH If Init(); 
/* Execute the IAP driver in order to reprogram the Flash */ 
TAP Init(); 
/* Display main menu */ 
Main Menu (); 
} 


/* Keep the user application running */ 














else 


/* Test if user code is programmed starting from address "APPLICATION ADDRESS" */ 
if (((*(__IO uint32_t*)APPLICATION ADDRESS) & 0x2FFE0000 ) == 0x20000000) 
{ 
/* Jump to user application */ 
JumpAddress = *( IO uint32_t*) (APPLICATION ADDRESS + 4); 
JumpToApplication = (pFunction) JumpAddress; 
/* Initialize user application's Stack Pointer */ 
set MSP (*(__IO uint32_t*) APPLICATION ADDRESS) ; 
JumpToApplication () ; 
} 
} 
while (1) 
{} 





此 代码 主要 分 成 两 部 分 : 





第 一 部 分 是 初始 化 ， 调 用 HAL_lnit(); 函 数 完 成 底层 硬件 接口 的 初始 化 ， 包 括 Flash 预 取 的 配置 、 系 统 定时 器 和 NVIC 的 配置 等 ; 调用 SystemClock_Config(); 函 数 完 
成 系统 时 钟 的 配置 ; 最 后 调用 BSP_PB_Init(BUTTON_KEY,BUTTON_MODE_GPIO); 函 数 对 触发 按键 进行 配置 。 


第 二 部 分 就 是 对 触发 按键 的 检测 和 分 支 跳 转 了 : if(BSP_PB_GetState(BUTTON KEY)==GPIO_PIN_RESET)。 
如 果 该 按键 按 下 ， 就 进入 BootLoader 升 级 模式 ， 实 现 应 用 程序 的 更 新 。 


首先 调用 FLASH _If_Init(); 函 数 对 内 部 Flash 进 行 初始 化 ; 然后 调用 IAP_lnit(0; 初 始 化 IAP 驱 动 ， 为 后 面 的 更 新 应 用 程序 做 准备 ， 该 函数 的 主要 工作 是 配置 升级 所 用 
的 串口 ; 最 后 调用 Main_Menu(); 函 数 进 行 菜单 升级 ， 该 函数 利用 Ymodem 协 议 进 行 应 用 程序 升级 。 在 Main_Menu(); 函 数 中 调用 SerialDownload(); 进 行 串口 下 
载 ，SerialDownload(); 函 数 利 用 Ymodem 协 议 下 载 数 据 并 调用 Flash 写 接口 进行 应 用 程序 升级 。 





如 果 没 有 检测 到 按键 按 下 ， 就 直接 执行 应 用 程序 : 


if (((*( IO uint32_t*)APPLICATION ADDRESS) & 0x2FFE0000 ) == 0x20000000) 
{ 

/* Jump to user application */ 

JumpAddress = *( IO uint32_t*) (APPLICATION ADDRESS + 4); 

JumpToApplication = (pFunction) JumpAddress; 

/* Initialize user application's Stack Pointer */ 

set MSP(*( IO uint32_t*) APPLICATION ADDRESS) ; 
JumpToApplication () ; 





APPLICATION_ADDRESS 的 定义 为 : 


#define APPLICATION ADDRESS (uint32_t)0x08004000 /* Start user code address: ADDR FLASH PAGE 8 */ 


查看 startup_stm32f107xc.s 中 的 中 断 向 量 表 的 定义 : 


_ Vector table 
DCD sfe (CSTACK) 
DCD Reset_Handler ; Reset Handler 


其 首 地 址 存放 的 是 堆栈 地 址 ， 所 以 *(_1O uint32_t*)APPLICATION_ADDRESS 运 算 获 取 的 就 是 堆栈 地 址 。 


这 个 if 语 句 判断 用 户 代码 的 堆栈 地 址 是 否 落 在 :0x20000000~0x2001ffff 区 间 ， 这 个 区 间 的 大 小 为 128KB。RAM 的 真实 地 址 是 0x20000000， 大 小 为 128KB。 这 个 
判断 是 可 以 通过 的 。 


下 面 先 通过 JumpAddress=*(_IO uint32_t*)(APPLICATION_ADDRESS+4); 取得 复位 地 址 ， 在 中 断 向 量 表 的 定义 中 我 们 知道 复位 地 址 是 在 代码 初始 地 址 的 基础 
上 加 4， 获 取 地 址 后 将 其 转化 为 函数 指针 。 最 后 设置 完 用 户 应 用 程序 的 栈 指针 后 就 跳 转 到 应 用 程序 ， 开 始 执行 。 





一 个 利用 Cortex-M 系 列 核 的 特定 IAP 和 通信 接口 (USART) 的 、 既 可 以 引导 应 用 程序 又 可 以 升级 应 用 程序 的 BootLoader 就 可 以 如 此 设计 。 这 里 给 出 了 在 
Cortex-M 核 下 设计 此 类 BootLoader 的 通用 流程 ， 值 得 参考 和 借鉴 。 
10.2 ”硬件 平台 pcDuino 简 介 


古人 讲 “ 知 行 合 一 ”， 现 代 人 讲 “ 实 践 出 真知 ”， 现 在 到 了 实践 的 时 候 了 。 我 们 在 前 面 几 章 介绍 了 深入 理解 BootLoader 所 必 备 的 理论 基础 : 处 理 器 体系 结构 、 
汇编 指令 集 、 编 译 链接 和 链接 脚本 等 。 本 章 简单 地 介绍 用 于 实践 的 硬件 平台 ， 为 后 面 几 章 理 论 联系 实践 的 内 容 做 准备 。 

















硬件 平台 选用 pcDuino nano， 它 的 核心 CPU 采用 ARM 内 核 。 选 择 基 于 ARM 内 核 的 CPU 主要 是 由 于 它 应 用 广泛 。 


pcDuino 又 是 什么 呢 ? 为 什么 在 众多 基于 ARM 的 开发 板 中 选择 pcDuino 呢 ? 


用 一 句 话 描述 pcDuino 的 话 ，pcDuino 就 是 Mini PC+Arduino。pcDuino 是 LinkSprite 推 出 的 一 台 Mini PC， 因 为 它 拥 有 高 性 能 的 ARM 处 理 器 、USB 接 口 、 
HDMI 显 示 输 出 、 网 络 接口 和 SATA 接 口 等 ， 并 可 以 像 PC 一 样 运行 Ubuntu 操作 系统 或 者 像 平板 电脑 一 样 运行 Arduino 操 作 系统 。 那 Arduino 是 什么 呢 ? Arduino 是 一 
个 开源 的 单 芯片 开发 板 ， 使 用 Atmel AVR 单 片 机 ， 采 用 了 基于 开放 源 代 码 的 软 硬 件 平台 ， 构 建 于 开放 源 代码 simple MO 接口 板 ， 并 且 具 有 使 用 类 似 于 Java、( 语 言 的 
Processing/Wiring 开 发 环境 。Arduino 是 全 球 最 流行 的 开源 硬件 ， 也 是 一 个 优秀 的 硬件 开发 平台 ， 更 是 硬件 开发 的 趋势 。Arduino 简 单 的 开发 方式 使 得 开发 者 更 关注 
创意 与 实现 ， 并 更 快 地 完成 自己 的 项 目 开发 ， 大 大 节约 了 学 习 的 成 本 ， 缩 得 了 开发 的 周期 。 





pcDuino 集 两 者 之 所 长 ， 将 高 性 能 的 ARM 处 理 器 和 最 流行 的 开源 硬件 合 二 为 一 ， 打 造 一 个 强大 的 平台 。 选 择 pcDuino， 我 们 既 可 以 学 习 诸 如 BootLoader、 计 算 
机 体系 结构 、Linux 操 作 系统 、 网 络 编程 等 ， 又 可 以 进行 五 花 八 门 的 创意 开发 。 在 本 书 中 ， 我 们 仅仅 利用 pcDuino 平 台 进行 BootLoader 的 学 习 。 读 者 可 以 在 理解 
BootLoader 后 进行 其 他 的 学 习 和 开发 。 


既然 是 以 pcDuino 作 为 开发 平台 ， 那 么 就 需要 对 pcDuino nano 的 硬件 做 一 个 更 全 面 的 了 解 。 


10.3 ”三 种 方式 实现 代码 复制 和 跳 转 


10.3.1 方式 一 


Makefile 如 下 。 


代码 清单 10-3: 第 一 种 方式 的 Makefile 


CFLAGS := -Wall -Wstrict-prototypes -00 -fomit-frame-pointer -ffreestanding 
all:start.S 

arm-linux-gcc $ (CFLAGS) -c -o start.o start.S 

arm-linux-gcc $ (CFLAGS) -c -o sdram.o sdram. S 





arm-linux-ld -T sram2sdram.lds start.o sdram.o -o sram2sdram elf 

arm-linux-objcopy -O binary -S sram2sdram elf sram2sdram.bin 

arm-linux-objdump -D -m arm sram2sdram elf > sram2sdram.dis 
clean: 

rm -f sram2sdram.dis sram2sdram.bin sram2sdram elf *.o 


链接 脚本 如 下 。 


代码 清单 10-4: 第 一 种 方式 的 链接 脚本 


OUTPUT_FORMAT ("elf32-littlearm", "elf32-littlearm", "elf32-littlearm") 
OUTPUT_ARCH (arm) 
ENTRY (_ start) 


SECTIONS { 

. = 0x00000020; 
.text ALIGN(4): {*(.text) } 
.rodata ALIGN(4) : {*(.rodata) } 


.data ALIGN(4) : {*(.data) } 
.bss ALIGN(4) : {*(.bss) * (COMMON) } 





其 中 ，start.S 文 件 包 含 了 程序 的 主题 部 分 ，sdram.S 主 要 是 DDR 初 始 化 的 代码 。 现 详细 分 析 一 下 代码 ， 程 序 最 开始 是 异常 向 量 的 处 理 ， 具 体 如 下 。 


代码 清单 10-5: start.S 中 异常 处 理 部 分 的 代码 片段 


global start 





_start: b reset 
Ldr pc, _undefined instruction 
ldr pc, _software_interrupt 
ldr pc, _prefetch_abort 
ldr pc, data abort 
ldr pc, _not used 
@bi rq 
ldr pc, _irg 
ldr pe, fiq 
undefined instruction: .word undefined instruction 
_software interrupt: .word software interrupt 
_prefetch abort: .word prefetch abort 
_data_abort: .word data_abort 
not_used: .word not used 
“irq: .word irq 
“fig: .word fig 


在 复位 异常 处 理 中 首先 禁止 开门 狗 watchdog， 然 后 配置 时 钟 、 中 断 模式 下 的 栈 指针 和 系统 模式 下 的 栈 指针 、 中 断 处 理 ， 接 着 调用 sunxi_dram_init 函 数 进行 DDR 
的 初始 化 ， 然 后 就 是 代码 的 复制 操作 ， 从 而 将 全 部 代码 从 内 部 的 SRAM 中 复制 到 DDR 中 ， 代 码 如 下 。 


代码 清单 10-6: start.S 中 的 代码 复制 操作 


ldr r2,=0x40000000 


ldr r1,=0 @@2048 
ldr r3,=0x8000 
copy: 
ldr r4, [r1], #4 @ 从 steppingstone 读 取 4 字 节 的 数据 ，r4=[r1],r1l=r1+4 
str r4, [r2], #4 @ 将 此 4 字 节 的 数据 复制 到 SDRAM 中 ，[r2]=r4,r2=r2+4 
cmp rl,r3 
bne copy 


复制 完 之 后 ， 进 行 代码 跳 转 ， 具 体 如 下 。 


代码 清单 10-7: start.S 中 的 代码 跳 转 


ldr r0,=on sdram 
add r0, r0, #0x40000000 
mov pc, r0 


这 里 将 on_sdram 的 地 址 加 上 0x40000000， 之 后 才能 正确 跳 转 到 SDRAM 中 ， 接 下 来 验证 跳 转 是 否 成 功 。 


代码 清单 10-8: 在 start.S 中 清除 SRAM 并 跳 转 至 main 


on_sdram: 
bl clearsram 
msr cpsr_c, #0xdf 
ldr sp,=0x44000000 
ldr lr,=halt_loop 
bl main 加 
halt_loop: 
b halt loop 


在 clearsram 代 码 段 中 将 内 部 的 SRAM 数 据 清 零 ， 然 后 运行 main 函 数 的 流水 灯 ， 结 果 表 明 跳 转 成 功 。 


10.4 实现 BootLoader 


什么 是 BootLoader? BootLoader 就 是 Boot 加 Loader。Boot 是 引导 ， 用 于 初始 化 各 种 硬件 设备 ， 比 如 存储 控制 器 (内 存 控制 和 外 围 存储 控制 ) 、 时 钟 和 电源 管 
理 等 ， 它 是 为 了 后 面 的 Loader 做 准备 的 ;Loader 是 加 载 器 ，Boot 准 备 好 了 程序 运行 的 环境 后 ， 那 么 Loader 就 将 要 执行 的 程序 从 非 易 失 1 


47. 


b= 








性 存储 设备 中 加 载 到 内 存 中 运 


我 们 一 般 讲 的 BootLoader 是 为 了 引导 特定 操作 系统 的 ， 但 是 广义 的 BootLoader 可 以 是 引导 某 个 特定 程序 的 。 我 们 先 以 一 个 引导 特定 程序 的 BootLoader 为 例 ， 


分 析 下 BootLoader 的 关键 构成 ， 再 在 这 个 基础 上 分 析 引 导 Linux 的 BootLoader 有 什么 特别 要 注意 的 地 方 。 


10.5 本章 小 结 


本 章 先 详细 地 分 析 了 在 MCU 下 设计 一 个 可 引导 、 可 升级 固件 的 BootLoader 的 通用 模板 程序 ， 然 后 详细 分 析 了 底 入 式 ARM 和 Linux 下 的 BootLoader 实 现 。 通 过 不 


同 平台 下 的 BootLoader 实 现 的 分 析 以 及 一 系列 Loader 方 式 的 分 析 来 加 深 对 Boot 和 Loader 的 理解 ， 真 正 做 到 能 够 举一反三 。 


